機械学習やAIの分類モデルを評価する際、「適合率(Precision)」は非常に重要な指標のひとつです。
特に「誤って陽性と判定してしまうリスク」を避けたい場面では欠かせません。
この記事では、適合率の基本的な考え方から計算方法、実務での使いどころ、さらに他の指標との違いまでを丁寧に解説します。
適合率(Precision)とは何か?
適合率とは、モデルが「陽性」と予測したものの中で、実際に正しかった割合を表す指標です。
たとえば、次のような場面で使われます:
- スパムメールの判定(本当にスパムかどうか)
- 不正取引の検知
- 医療検査での陽性判定
つまり、「陽性と判断した結果の信頼性」を測る指標です。
まずは基本:4つの分類結果を理解する
適合率を理解するには、分類問題の基本となる4つの結果を押さえる必要があります。
| 用語 | 意味 |
|---|---|
| 真陽性(TP) | 陽性と予測し、実際も陽性 |
| 真陰性(TN) | 陰性と予測し、実際も陰性 |
| 偽陽性(FP) | 陽性と予測したが、実際は陰性 |
| 偽陰性(FN) | 陰性と予測したが、実際は陽性 |
この中で、適合率に関係するのは**真陽性(TP)と偽陽性(FP)**です。
適合率の計算方法
適合率は次の式で求められます。
適合率 = 真陽性 ÷(真陽性 + 偽陽性)
具体例で理解する
100件のデータのうち、モデルが「陽性」と予測したものが10件あったとします。
- 真陽性:1件(正しく当たった)
- 偽陽性:9件(誤判定)
この場合、
1 ÷(1 + 9)= 0.1(10%)
つまり、陽性と判断した結果のうち、実際に正しかったのは10%だけということになります。
適合率の特徴と注意点
陰性データの数には影響されない
適合率は「陽性と予測したもの」だけを対象に計算するため、全体のデータ数や陰性の多さには左右されません。
そのため、次のようなケースで特に有効です:
- 陽性が非常に少ない(クラス不均衡)
- 陽性の誤検出を避けたい
適合率が重要になる具体的なケース
適合率は、誤って陽性と判定することが大きな問題になる場面で重視されます。
代表例
- スパムメール判定
→ 重要なメールを誤ってスパム扱いしないため - 不正検知(クレジットカードなど)
→ 正常な取引を不正と誤判定しないため - 広告配信のターゲティング
→ 興味のないユーザーへの誤配信を減らす
他の評価指標との違い
AIモデルの評価では、適合率だけでなく他の指標も併用することが重要です。
正解率(Accuracy)との違い
- 正解率:全体の中でどれだけ正しかったか
- 適合率:陽性と予測した中でどれだけ正しかったか
正解率はデータの偏りに弱いため、適合率の方が実務で重視されるケースも多くあります。
再現率(Recall)との違い
- 適合率:誤検知(FP)をどれだけ減らせるか
- 再現率:見逃し(FN)をどれだけ防げるか
イメージ
- 適合率重視 →「間違って陽性にしない」
- 再現率重視 →「本当の陽性を見逃さない」
この2つはトレードオフの関係にあるため、バランスが重要です。
実務での使い分けポイント
目的に応じて、どの指標を重視するかを決める必要があります。
適合率を優先すべき場合
- 誤判定のコストが高い
- ユーザー体験を損ねたくない
他指標と組み合わせる
- 適合率 + 再現率 → バランス評価
- F1スコア → 両者の調和平均で総合評価
まとめ
適合率(Precision)は、AIモデルの評価において「陽性予測の信頼性」を測る重要な指標です。
ポイントを整理すると:
- 適合率は「陽性と予測した結果の正確さ」を示す
- 真陽性と偽陽性から計算される
- データの偏りに強い特徴がある
- 誤検知を避けたい場面で特に重要
- 再現率や正解率と併用することでより正確な評価が可能
AIの精度評価では、「何を重視するか」によって最適な指標は変わります。
適合率の特性を正しく理解し、用途に応じて使いこなすことが、実務で成果を出すための鍵となります。
こちらもご覧ください:正解率(Accuracy)とは?AI評価指標の基本と注意点をわかりやすく解説

