落ちこぼれナースの統計チャレンジ

元落ちこぼれ看護師(保健師)が、私と同じく統計にドキドキしている看護学生や保健師さんに、簡単な言葉で届けるために始めたブログです。

中学生でも分かる!?統計&機械学習の数学〜混同行列と4つの指標、精度・F1スコア〜


今回もやってきました、中学生でも分かる!?統計&機械学習の数学シリーズのお時間です。

前回は「ROC曲線とAUC」について、検査やモデルの性能をどうやって測るのかをお話ししました。まだ読んでいない方やどんなのか忘れた方は、是非ご参照くださいね。

実は、その土台には 混同行列 という検査やモデルの「成績表」みたいなものがあります。
今日はそこから派生して、他の指標も一緒に見ていきましょう。

それでは、レッツゴーーーー!!!!!


混同行列

混同行列は、以下のように表されます。

予測\実際本当は陽性本当は陰性
陽性と予測TP(真陽性)FP(偽陽性)
第一種の過誤
陰性と予測FN(偽陰性)
第二種の過誤
TN(真陰性)
  • TP(True Positive, 真陽性): 本当に病気の人を「病気あり」と当てた
  • FN(False Negative, 偽陰性): 本当に病気なのに「病気なし」と見逃した
  • FP(False Positive, 偽陽性): 本当は健康なのに「病気あり」と誤判定した
  • TN(True Negative, 真陰性): 本当に健康な人を「健康」と正しく判定した

つまり混同行列は「予測と正解を合わせた表」なのです。

人によっては、看護学生時代にこの図を見たことがあるかもしれません。
そう、それです!!!!!

これを機に学び直しちゃいましょう。

精度(Accuracy)

精度は「全部でどれだけ当たったか」を見る指標です。

「とりあえず全部合わせてどのくらい当たったか」を見ています。

感度(Sensitivity)
再現率( Recall)

「見逃しを防ぐ力」です。検診やスクリーニングでは重要な指標ですね。

偽陰性を避けたい時にはこの指標を重視しますが、誤報が増えやすいです。

特異度(Specificity)

「誤警報を防ぐ力」です。無駄な精密検査を減らします。

陽性的中率(Positive Predictive Value, PPV)
適合率(Precision)

「検査で陽性と出た人のうち、本当に病気の人の割合」です。

偽陽性を避けたい時にはこの指標を重視しますが、見逃しが増えやすくなります。

陰性的中率(Negative Predictive Value, NPV)

「陰性と判定された人のうち、本当に陰性だった割合」です。

F1スコア

これはあまり聞いたことがない人も多いかもしれませんね。

適合率(=陽性的中率)と再現率(=感度)のバランス評価のことです。

つまり、適合率と再現率のバランスを取っています。


ただし、データの偏りを受けやすい指標でもあり、例として陽性のデータが少ない場合、検査やモデルが全部のデータを「これは陰性だよ!!」と予測してしまうこともあります。
これではF1スコアが高くても、実際には使い物にならなくなってしまいます。

偽陽性を避けたいときは適合率(=陽性的中率)、病気の診断など偽陰性を避けたい場合は再現率(=感度)を採用することもあります。

つまり、どれを使うかはケースバイケースです。

まとめ

最後に、今までの説明をまとめます。

  • 混同行列:予測と実際の照合表
  • 精度:全体の正答率
  • 感度(再現率):見逃しを防ぐ力
  • 特異度:誤警報を防ぐ力
  • 陽性的中率(適合率):陽性判定の信頼度
  • 陰性的中率:陰性判定の信頼度
  • F1スコア:適合率と再現率のバランス

前回の記事にも書いた通り、この世に完璧な検査やモデルは存在しません。ままならぬものよ……
それぞれの指標の強み・弱みを知っておくことが大切です。

今回はここまで。次の記事でお会いしましょう!!


コメントを残す