機械学習やAIモデルの性能を評価する際、「正解率(Accuracy)」という言葉をよく目にします。
一見シンプルな指標ですが、使い方を誤るとモデルの性能を正しく判断できないこともあります。
この記事では、正解率の基本から計算方法、注意点、さらに実務で重要な「適合率(Precision)」や「再現率(Recall)」との違いまで、初心者にもわかりやすく解説します。
正解率(Accuracy)とは何か?
正解率とは、モデルの予測がどれだけ正しかったかを示す割合です。
主に「ある対象がXかどうか」を判定する分類問題で使われます。
たとえば以下のようなケースです:
- 病気に「かかっている/いない」を判定
- 製品が「合格/不合格」かを判断
- メールが「スパム/通常」かを分類
4つの分類結果(TP・TN・FP・FN)を理解する
正解率を理解するには、まず予測結果の4つのパターンを押さえる必要があります。
| 用語 | 内容 |
|---|---|
| 真陽性(TP) | 陽性と予測し、実際も陽性 |
| 真陰性(TN) | 陰性と予測し、実際も陰性 |
| 偽陽性(FP) | 陽性と予測したが、実際は陰性 |
| 偽陰性(FN) | 陰性と予測したが、実際は陽性 |
これらはまとめて「混同行列(Confusion Matrix)」の要素と呼ばれます。
正解率の計算方法
正解率は以下の式で求められます。
正解率 =(真陽性 + 真陰性) ÷ 全体の数
具体例
100件のデータに対して:
- 真陽性:10件
- 真陰性:80件
この場合、
(10 + 80) ÷ 100 = 0.9(90%)
つまり、90%の確率で正しく予測できていることになります。
正解率の落とし穴:偏ったデータに弱い
正解率は便利な指標ですが、データの偏り(クラス不均衡)に弱いという欠点があります。
具体例
- 100件中99件が「陰性」
- モデルがすべて「陰性」と予測
この場合:
- 正解率は99%
- しかし「陽性」は1件も見つけられていない
つまり、実用上は役に立たないモデルでも高い正解率が出てしまうのです。
精度を補完する指標:適合率と再現率
この問題を補うために、他の評価指標も併用します。
適合率(Precision)
陽性と予測した中で、どれだけ正しかったか
適合率 = 真陽性 ÷(真陽性 + 偽陽性)
- 誤検知(FP)を減らしたい場合に重要
- 例:スパムメール判定(誤って重要メールをスパム扱いしたくない)
再現率(Recall)
実際の陽性のうち、どれだけ見つけられたか
再現率 = 真陽性 ÷(真陽性 + 偽陰性)
- 見逃し(FN)を減らしたい場合に重要
- 例:病気の検査(見逃しは致命的)
実務での使い分けのポイント
用途によって重視すべき指標は異なります。
正解率が有効なケース
- データに偏りが少ない
- 全体的な精度をざっくり把握したい
適合率を重視すべきケース
- 誤検知がコストになる場合
- 例:不正検知、広告配信
再現率を重視すべきケース
- 見逃しが重大な問題になる場合
- 例:医療診断、故障検知
まとめ
正解率は、AIモデルの性能を評価するうえで最も基本的な指標ですが、万能ではありません。
重要なポイントを整理すると:
- 正解率は「全体の正しさ」を表すシンプルな指標
- TP・TN・FP・FNの理解が前提
- データの偏りがあると誤解を招く可能性がある
- 適合率・再現率と組み合わせて使うのが実務では必須
AIの評価では、「どの指標を使うか」がそのまま成果に直結します。
目的に応じて適切な指標を選ぶことが、精度の高いモデル構築への第一歩です。
こちらもご覧ください:混同行列(Confusion Matrix)とは?精度評価の基本と指標の見方を徹底解説

