再現率(Recall)とは?AI評価で重要な理由と計算方法をわかりやすく解説

再現率(Recall)とは?

機械学習やAIモデルの評価では、「見逃しをどれだけ防げるか」が重要になる場面が多くあります。

その際に用いられる代表的な指標が「再現率(Recall)」です。医療や不正検知など、重大なリスクを伴う分野では特に重視されます。

この記事では、再現率の基本から計算方法、活用シーン、さらに適合率や正解率との違いまで、実務に役立つ視点でわかりやすく解説します。

再現率(Recall)とは何か?

再現率とは、実際に陽性であるデータのうち、どれだけ正しく陽性と予測できたかを示す指標です。
別名で「感度(Sensitivity)」とも呼ばれます。

たとえば、病気の検査で「本当に病気の人をどれだけ見つけられたか」を測るイメージです。

基本となる4つの分類結果

再現率を理解するためには、分類問題における以下の4つの結果を把握する必要があります。

用語 内容
真陽性(TP) 陽性と予測し、実際も陽性
真陰性(TN) 陰性と予測し、実際も陰性
偽陽性(FP) 陽性と予測したが、実際は陰性
偽陰性(FN) 陰性と予測したが、実際は陽性

このうち、再現率に関係するのは**真陽性(TP)と偽陰性(FN)**です。

再現率の計算方法

再現率は次の式で求められます。

再現率 = 真陽性 ÷(真陽性 + 偽陰性)

具体例

100件のデータのうち、実際に陽性のものが10件あったとします。

  • 真陽性:9件(正しく検出)
  • 偽陰性:1件(見逃し)

この場合、

9 ÷(9 + 1)= 0.9(90%)

つまり、実際の陽性のうち90%を正しく見つけられているという意味になります。

再現率の特徴と重要性

見逃し(偽陰性)に注目する指標

再現率は、どれだけ見逃しを減らせているかに焦点を当てた指標です。

  • 再現率が高い → 見逃しが少ない
  • 再現率が低い → 見逃しが多い

再現率が重要になる具体例

再現率は、見逃しが重大な問題につながる場面で特に重要です。

代表的なケース

  • 医療診断(がん検査など)
    → 病気を見逃すと命に関わるため、再現率が最重要
  • 不正検知(クレジットカードなど)
    → 不正を見逃すと大きな損失につながる
  • 故障検知・異常検知
    → 異常を見逃すと事故やシステム障害の原因になる

他の評価指標との違い

AIモデルの評価では、再現率単体ではなく、他の指標と組み合わせて使うことが重要です。

適合率(Precision)との違い

  • 再現率:実際の陽性をどれだけ見つけたか
  • 適合率:陽性と予測した中でどれだけ正しかったか

トレードオフの関係

  • 再現率を上げる → 陽性と判断する範囲が広がる → 偽陽性が増えやすい
  • 適合率を上げる → 判定が厳しくなる → 見逃し(偽陰性)が増えやすい

正解率(Accuracy)との違い

  • 正解率:全体の予測の正しさ
  • 再現率:陽性データに対する検出力

データに偏りがある場合、正解率だけでは性能を正しく評価できないため、再現率が重要になります。

実務での使い分けポイント

目的に応じて、どの指標を優先するかを決める必要があります。

再現率を優先すべき場面

  • 見逃しが致命的な問題になる
  • 安全性・リスク回避を最優先する

バランス評価も重要

  • 適合率とのバランス → F1スコアを活用
  • 複数指標を組み合わせて総合的に判断

まとめ

再現率(Recall)は、AIモデルの評価において「見逃しをどれだけ防げるか」を測る重要な指標です。

ポイントを整理すると:

  • 再現率は「実際の陽性の検出率」を表す
  • 真陽性と偽陰性から計算される
  • 陰性データの数には影響されない
  • 医療や不正検知など、見逃しが許されない分野で重要
  • 適合率や正解率と組み合わせて評価するのが実務の基本

AIの評価では、「どの失敗を許容するか」によって最適な指標が変わります。

再現率の意味と役割を正しく理解し、目的に応じた適切な評価を行うことが、信頼性の高いAIシステム構築につながります。

こちらもご覧ください:適合率(Precision)とは?AI評価で重要な理由と計算方法をわかりやすく解説

 

Rate this post
Visited 5 times, 5 visit(s) today