再現率（Recall）とは？AI評価で重要な理由と計算方法をわかりやすく解説

機械学習やAIモデルの評価では、「見逃しをどれだけ防げるか」が重要になる場面が多くあります。

その際に用いられる代表的な指標が「再現率（Recall）」です。医療や不正検知など、重大なリスクを伴う分野では特に重視されます。

この記事では、再現率の基本から計算方法、活用シーン、さらに適合率や正解率との違いまで、実務に役立つ視点でわかりやすく解説します。

再現率（Recall）とは何か？

再現率とは、実際に陽性であるデータのうち、どれだけ正しく陽性と予測できたかを示す指標です。
別名で「感度（Sensitivity）」とも呼ばれます。

たとえば、病気の検査で「本当に病気の人をどれだけ見つけられたか」を測るイメージです。

基本となる4つの分類結果

再現率を理解するためには、分類問題における以下の4つの結果を把握する必要があります。

用語	内容
真陽性（TP）	陽性と予測し、実際も陽性
真陰性（TN）	陰性と予測し、実際も陰性
偽陽性（FP）	陽性と予測したが、実際は陰性
偽陰性（FN）	陰性と予測したが、実際は陽性

このうち、再現率に関係するのは**真陽性（TP）と偽陰性（FN）**です。

再現率の計算方法

再現率は次の式で求められます。

再現率＝真陽性 ÷（真陽性 + 偽陰性）

具体例

100件のデータのうち、実際に陽性のものが10件あったとします。

真陽性：9件（正しく検出）
偽陰性：1件（見逃し）

この場合、

9 ÷（9 + 1）＝ 0.9（90%）

つまり、実際の陽性のうち90%を正しく見つけられているという意味になります。

再現率の特徴と重要性

見逃し（偽陰性）に注目する指標

再現率は、どれだけ見逃しを減らせているかに焦点を当てた指標です。

再現率が高い → 見逃しが少ない
再現率が低い → 見逃しが多い

再現率が重要になる具体例

再現率は、見逃しが重大な問題につながる場面で特に重要です。

代表的なケース

医療診断（がん検査など）
→ 病気を見逃すと命に関わるため、再現率が最重要
不正検知（クレジットカードなど）
→ 不正を見逃すと大きな損失につながる
故障検知・異常検知
→ 異常を見逃すと事故やシステム障害の原因になる

他の評価指標との違い

AIモデルの評価では、再現率単体ではなく、他の指標と組み合わせて使うことが重要です。

適合率（Precision）との違い

再現率：実際の陽性をどれだけ見つけたか
適合率：陽性と予測した中でどれだけ正しかったか

トレードオフの関係

再現率を上げる → 陽性と判断する範囲が広がる → 偽陽性が増えやすい
適合率を上げる → 判定が厳しくなる → 見逃し（偽陰性）が増えやすい

正解率（Accuracy）との違い

正解率：全体の予測の正しさ
再現率：陽性データに対する検出力

データに偏りがある場合、正解率だけでは性能を正しく評価できないため、再現率が重要になります。

実務での使い分けポイント

目的に応じて、どの指標を優先するかを決める必要があります。

再現率を優先すべき場面

見逃しが致命的な問題になる
安全性・リスク回避を最優先する

バランス評価も重要

適合率とのバランス → F1スコアを活用
複数指標を組み合わせて総合的に判断

まとめ

再現率（Recall）は、AIモデルの評価において「見逃しをどれだけ防げるか」を測る重要な指標です。

ポイントを整理すると：

再現率は「実際の陽性の検出率」を表す
真陽性と偽陰性から計算される
陰性データの数には影響されない
医療や不正検知など、見逃しが許されない分野で重要
適合率や正解率と組み合わせて評価するのが実務の基本

AIの評価では、「どの失敗を許容するか」によって最適な指標が変わります。

再現率の意味と役割を正しく理解し、目的に応じた適切な評価を行うことが、信頼性の高いAIシステム構築につながります。

こちらもご覧ください：適合率（Precision）とは？AI評価で重要な理由と計算方法をわかりやすく解説

Rate this post

Visited 96 times, 1 visit(s) today