無理がありすぎるタイトルって言わないで。やめて。
今日はちょっとかっこよさのある言葉を紹介します。
その名も「ROC曲線」と「AUC」。
……え、ロック(ROC)ってロックバンドの新曲かって?
残念ながらギターやドラムは出てきません。
でも医療や看護に関わる皆さんには、とっても大事な考え方なんです。
今回の記事は機械学習の考え方に近いので「ゆるっと機械学習」から入ってきた方には馴染みがあるかもしれませんが、「ゆるっと統計学」から入った方にとっては少し応用的な内容かもしれません。
しかし、医療統計の考え方としては知っておいて損はありませんよ。
それでは、そんなROC曲線とAUCについて学んでいきましょう!!!
レッツゴーーーーー!!!
ROC曲線(receiver operating characteristic curve)って何者?
例えば、ある新しい検査で「この人は糖尿病リスクが高いかどうか」を判定する、とします。
でも現実は「100%正しく当てられる検査」なんて存在しませんよね。
- 本当はリスクが高いのに「異常ないっすよ〜!」と出る人(見逃し)
- 本当は大丈夫なのに「危ねえぞ〜!」と出る人(誤検出)
この両方のバランスをどう取るか?を見やすくしたのが ROC曲線 なんです。
図にすると、横軸は「偽陽性率(誤検出)」、縦軸は「真陽性率(ちゃんと当てた割合)」。
判定基準を変えていくと、このグラフに線が描かれていきます。
イメージ的には、
「どのくらい上手に患者さんを拾えているか」
「そのためにどのくらい健康な人を巻き込んでしまっているか」
を表す曲線です。
実際のROC曲線はこちら。

ちょっと軸に張り付いている部分がありますが、青の線がROC曲線です。
オレンジの無作為分類は、「完全に当てずっぽう」な場合の形の線と考えてください。
つまり、ROC曲線(青)が無作為分類(オレンジ)から遠いほど、理想の検査に近いのです。
でも、ROC曲線を見るだけで「この検査は理想だ」「いや、当てずっぽうに近い」と判断するのはちょっと心許ないです。
そこで活躍するのが、後述するAUCです。
AUCって何者?
ROC曲線を出すと、「曲線の下の面積」を計算できます。
これが AUC(area under the curve)。通常0.5〜1の値をとります。
下のグラフの青く塗りつぶされた部分がAUCです。

- AUC=1.0 :神の検査(完璧)
- AUC=0.5 :コイントス(完全に運まかせ)
- AUCが0.7とか0.8くらい:「そこそこ使える」検査
という目安になります。
つまりAUCは「その検査(モデル)がどれくらい役に立つか」をざっくり点数化した指標なんです。
医療の現場では「感度・特異度」をよく聞くと思いますが、
AUCはそれをまとめて、全体的な性能を一目で示す超便利アイテムです。
看護・保健の現場でどう役立つ?
例えばストレスチェックのデータを解析して、
「将来うつ病リスクが高まる人を予測するモデル」を作ったとします。
AUCが高ければ、
「このモデルを参考にすることで、リスクのある人を早めに支援できそうだ!」
と判断できます。
逆にAUCが低ければ、
「ちょっとこのモデル、現場に使うには微妙だな…」
と冷静に見極められます。
まとめ
ROC曲線とAUCは、結局のところ、
「検査やモデルがどれくらい正しく人を見分けられるか」を「曲線と数字」でシンプルに示すツールです。
次回は「じゃあ実際に数式でどう表せるの?」という数学的な世界を、もう少し丁寧に探検してみましょう。数学から逃げないでくださいね。地平線の果てまで追いかけ回しますから。ケケケケケ………
それではみなさん、またお会いしましょう!!
