今回もやってきました、中学生でも分かる!?統計&機械学習の数学シリーズのお時間です。
前回は「ROC曲線とAUC」について、検査やモデルの性能をどうやって測るのかをお話ししました。まだ読んでいない方やどんなのか忘れた方は、是非ご参照くださいね。
実は、その土台には 混同行列 という検査やモデルの「成績表」みたいなものがあります。
今日はそこから派生して、他の指標も一緒に見ていきましょう。
それでは、レッツゴーーーー!!!!!
混同行列
混同行列は、以下のように表されます。
| 予測\実際 | 本当は陽性 | 本当は陰性 |
| 陽性と予測 | TP(真陽性) | FP(偽陽性) 第一種の過誤 |
| 陰性と予測 | FN(偽陰性) 第二種の過誤 | TN(真陰性) |
- TP(True Positive, 真陽性): 本当に病気の人を「病気あり」と当てた
- FN(False Negative, 偽陰性): 本当に病気なのに「病気なし」と見逃した
- FP(False Positive, 偽陽性): 本当は健康なのに「病気あり」と誤判定した
- TN(True Negative, 真陰性): 本当に健康な人を「健康」と正しく判定した
つまり混同行列は「予測と正解を合わせた表」なのです。
人によっては、看護学生時代にこの図を見たことがあるかもしれません。
そう、それです!!!!!
これを機に学び直しちゃいましょう。
精度(Accuracy)
精度は「全部でどれだけ当たったか」を見る指標です。

「とりあえず全部合わせてどのくらい当たったか」を見ています。
感度(Sensitivity)
再現率( Recall)

「見逃しを防ぐ力」です。検診やスクリーニングでは重要な指標ですね。
偽陰性を避けたい時にはこの指標を重視しますが、誤報が増えやすいです。
特異度(Specificity)

「誤警報を防ぐ力」です。無駄な精密検査を減らします。
陽性的中率(Positive Predictive Value, PPV)
適合率(Precision)

「検査で陽性と出た人のうち、本当に病気の人の割合」です。
偽陽性を避けたい時にはこの指標を重視しますが、見逃しが増えやすくなります。
陰性的中率(Negative Predictive Value, NPV)

「陰性と判定された人のうち、本当に陰性だった割合」です。
F1スコア
これはあまり聞いたことがない人も多いかもしれませんね。
適合率(=陽性的中率)と再現率(=感度)のバランス評価のことです。

つまり、適合率と再現率のバランスを取っています。
ただし、データの偏りを受けやすい指標でもあり、例として陽性のデータが少ない場合、検査やモデルが全部のデータを「これは陰性だよ!!」と予測してしまうこともあります。
これではF1スコアが高くても、実際には使い物にならなくなってしまいます。
偽陽性を避けたいときは適合率(=陽性的中率)、病気の診断など偽陰性を避けたい場合は再現率(=感度)を採用することもあります。
つまり、どれを使うかはケースバイケースです。
まとめ
最後に、今までの説明をまとめます。
- 混同行列:予測と実際の照合表
- 精度:全体の正答率
- 感度(再現率):見逃しを防ぐ力
- 特異度:誤警報を防ぐ力
- 陽性的中率(適合率):陽性判定の信頼度
- 陰性的中率:陰性判定の信頼度
- F1スコア:適合率と再現率のバランス
前回の記事にも書いた通り、この世に完璧な検査やモデルは存在しません。ままならぬものよ……
それぞれの指標の強み・弱みを知っておくことが大切です。
今回はここまで。次の記事でお会いしましょう!!
