機械学習やAIモデルの評価では、「見逃しをどれだけ防げるか」が重要になる場面が多くあります。
その際に用いられる代表的な指標が「再現率(Recall)」です。医療や不正検知など、重大なリスクを伴う分野では特に重視されます。
この記事では、再現率の基本から計算方法、活用シーン、さらに適合率や正解率との違いまで、実務に役立つ視点でわかりやすく解説します。
再現率(Recall)とは何か?
再現率とは、実際に陽性であるデータのうち、どれだけ正しく陽性と予測できたかを示す指標です。
別名で「感度(Sensitivity)」とも呼ばれます。
たとえば、病気の検査で「本当に病気の人をどれだけ見つけられたか」を測るイメージです。
基本となる4つの分類結果
再現率を理解するためには、分類問題における以下の4つの結果を把握する必要があります。
| 用語 | 内容 |
|---|---|
| 真陽性(TP) | 陽性と予測し、実際も陽性 |
| 真陰性(TN) | 陰性と予測し、実際も陰性 |
| 偽陽性(FP) | 陽性と予測したが、実際は陰性 |
| 偽陰性(FN) | 陰性と予測したが、実際は陽性 |
このうち、再現率に関係するのは**真陽性(TP)と偽陰性(FN)**です。
再現率の計算方法
再現率は次の式で求められます。
再現率 = 真陽性 ÷(真陽性 + 偽陰性)
具体例
100件のデータのうち、実際に陽性のものが10件あったとします。
- 真陽性:9件(正しく検出)
- 偽陰性:1件(見逃し)
この場合、
9 ÷(9 + 1)= 0.9(90%)
つまり、実際の陽性のうち90%を正しく見つけられているという意味になります。
再現率の特徴と重要性
見逃し(偽陰性)に注目する指標
再現率は、どれだけ見逃しを減らせているかに焦点を当てた指標です。
- 再現率が高い → 見逃しが少ない
- 再現率が低い → 見逃しが多い
再現率が重要になる具体例
再現率は、見逃しが重大な問題につながる場面で特に重要です。
代表的なケース
- 医療診断(がん検査など)
→ 病気を見逃すと命に関わるため、再現率が最重要 - 不正検知(クレジットカードなど)
→ 不正を見逃すと大きな損失につながる - 故障検知・異常検知
→ 異常を見逃すと事故やシステム障害の原因になる
他の評価指標との違い
AIモデルの評価では、再現率単体ではなく、他の指標と組み合わせて使うことが重要です。
適合率(Precision)との違い
- 再現率:実際の陽性をどれだけ見つけたか
- 適合率:陽性と予測した中でどれだけ正しかったか
トレードオフの関係
- 再現率を上げる → 陽性と判断する範囲が広がる → 偽陽性が増えやすい
- 適合率を上げる → 判定が厳しくなる → 見逃し(偽陰性)が増えやすい
正解率(Accuracy)との違い
- 正解率:全体の予測の正しさ
- 再現率:陽性データに対する検出力
データに偏りがある場合、正解率だけでは性能を正しく評価できないため、再現率が重要になります。
実務での使い分けポイント
目的に応じて、どの指標を優先するかを決める必要があります。
再現率を優先すべき場面
- 見逃しが致命的な問題になる
- 安全性・リスク回避を最優先する
バランス評価も重要
- 適合率とのバランス → F1スコアを活用
- 複数指標を組み合わせて総合的に判断
まとめ
再現率(Recall)は、AIモデルの評価において「見逃しをどれだけ防げるか」を測る重要な指標です。
ポイントを整理すると:
- 再現率は「実際の陽性の検出率」を表す
- 真陽性と偽陰性から計算される
- 陰性データの数には影響されない
- 医療や不正検知など、見逃しが許されない分野で重要
- 適合率や正解率と組み合わせて評価するのが実務の基本
AIの評価では、「どの失敗を許容するか」によって最適な指標が変わります。
再現率の意味と役割を正しく理解し、目的に応じた適切な評価を行うことが、信頼性の高いAIシステム構築につながります。
こちらもご覧ください:適合率(Precision)とは?AI評価で重要な理由と計算方法をわかりやすく解説

