落ちこぼれナースの統計チャレンジ

元落ちこぼれ看護師(保健師)が、私と同じく統計にドキドキしている看護学生や保健師さんに、簡単な言葉で届けるために始めたブログです。

YOU SEI, 真偽が胸を刺激する〜ROC曲線とAUC〜


無理がありすぎるタイトルって言わないで。やめて。

今日はちょっとかっこよさのある言葉を紹介します。
その名も「ROC曲線」と「AUC」。

……え、ロック(ROC)ってロックバンドの新曲かって?
残念ながらギターやドラムは出てきません。
でも医療や看護に関わる皆さんには、とっても大事な考え方なんです。

今回の記事は機械学習の考え方に近いので「ゆるっと機械学習」から入ってきた方には馴染みがあるかもしれませんが、「ゆるっと統計学」から入った方にとっては少し応用的な内容かもしれません。
しかし、医療統計の考え方としては知っておいて損はありませんよ。

それでは、そんなROC曲線とAUCについて学んでいきましょう!!!

レッツゴーーーーー!!!


ROC曲線(receiver operating characteristic curve)って何者?

例えば、ある新しい検査で「この人は糖尿病リスクが高いかどうか」を判定する、とします。

でも現実は「100%正しく当てられる検査」なんて存在しませんよね。

  • 本当はリスクが高いのに「異常ないっすよ〜!」と出る人(見逃し)
  • 本当は大丈夫なのに「危ねえぞ〜!」と出る人(誤検出)

この両方のバランスをどう取るか?を見やすくしたのが ROC曲線 なんです。

図にすると、横軸は「偽陽性率(誤検出)」、縦軸は「真陽性率(ちゃんと当てた割合)」。
判定基準を変えていくと、このグラフに線が描かれていきます。

イメージ的には、
「どのくらい上手に患者さんを拾えているか」
「そのためにどのくらい健康な人を巻き込んでしまっているか」
を表す曲線です。

実際のROC曲線はこちら。

ちょっと軸に張り付いている部分がありますが、青の線がROC曲線です。

オレンジの無作為分類は、「完全に当てずっぽう」な場合の形の線と考えてください。

つまり、ROC曲線(青)が無作為分類(オレンジ)から遠いほど、理想の検査に近いのです。

でも、ROC曲線を見るだけで「この検査は理想だ」「いや、当てずっぽうに近い」と判断するのはちょっと心許ないです。

そこで活躍するのが、後述するAUCです。

AUCって何者?

ROC曲線を出すと、「曲線の下の面積」を計算できます。
これが AUC(area under the curve)。通常0.5〜1の値をとります。
下のグラフの青く塗りつぶされた部分がAUCです。

  • AUC=1.0 :神の検査(完璧)
  • AUC=0.5 :コイントス(完全に運まかせ)
  • AUCが0.7とか0.8くらい:「そこそこ使える」検査

という目安になります。

つまりAUCは「その検査(モデル)がどれくらい役に立つか」をざっくり点数化した指標なんです。
医療の現場では「感度・特異度」をよく聞くと思いますが、
AUCはそれをまとめて、全体的な性能を一目で示す超便利アイテムです。

看護・保健の現場でどう役立つ?

例えばストレスチェックのデータを解析して、
「将来うつ病リスクが高まる人を予測するモデル」を作ったとします。

AUCが高ければ、
「このモデルを参考にすることで、リスクのある人を早めに支援できそうだ!」
と判断できます。

逆にAUCが低ければ、
「ちょっとこのモデル、現場に使うには微妙だな…」
と冷静に見極められます。

まとめ

ROC曲線とAUCは、結局のところ、

「検査やモデルがどれくらい正しく人を見分けられるか」を「曲線と数字」でシンプルに示すツールです。

次回は「じゃあ実際に数式でどう表せるの?」という数学的な世界を、もう少し丁寧に探検してみましょう。数学から逃げないでくださいね。地平線の果てまで追いかけ回しますから。ケケケケケ………

それではみなさん、またお会いしましょう!!


コメントを残す