はいさい!ツシマです。
今回も一緒に、難しそうで敬遠されがちな「機械学習」の世界を、ゆる〜〜く散歩していきましょう。
今回のテーマは 「教師なし学習」。
……え?「教師なしって、何!?それもう学級崩壊じゃないの!?」と思いました?
安心してください。「ごくせん」みたいに不良生徒が勝手に騒ぎ出すわけじゃありません!!
どちらかと言えば、共通点を持つ不良生徒が仲間を作って結託するようなものです(それも怖いか…)
それでは、いつも通り説明していきます。
レッツゴーーーーー!!!
教師なし学習とは?
「教師なし学習」は、正解ラベルがなくてもデータを見てパターンを見つけ出す方法。
イメージは看護学生が事前にどんなスタッフがいるか知らない状態で病棟実習に放り込まれるみたいな感じです。
つまり――
- 「教師あり学習」:友達から事前に怖い看護師さん・優しい看護師さんについて情報を貰って実習に行く。そして実際に確かめる。回帰(ロジスティック回帰・線形回帰)・分類(決定木・ランダムフォレスト)はこの分類に入る。
- 「教師なし学習」:前情報なしでいきなり実習に行かされ、怖い看護師さんと優しい看護師さんを自分で見つける。
こんな違いがあります。ね、病棟に怖い看護師さんがいるかどうかは大事な情報でしょ?
具体的な手法
さて、この「先生なし」状態でどうやって学ぶのか?
代表的なのは次の2つです。
1. クラスタリング
「似たもの同士をまとめる」やり方です。
- 例:ストレスチェックの結果をもとに、似た回答をする人たちをグループ化(クラスター)。
- 実際には k-means法(k平均法)(データを近いクラスターにまとめる) とか 階層クラスタリング(クラスターのまとめ方を考える) などが使われます。
看護学生に例えると、実習のときに「Aチームの看護師さんは優しい、Bチームの看護師さんはアクが強い…」と、勝手に頭の中でチーム分けしてるのと似てます。
2. 次元削減
「データが多すぎてよくわからん!」というときに、特徴をギュッと圧縮する方法です。
- 例:ストレスチェック80項目 → 実は「仕事」「人間関係」「睡眠」の3つの要素にまとめられる
イメージとしては、カルテのなが〜い経過記録を3行でまとめる凄腕看護師の技です。
医療での活用例
「でも医療にどう役立つの?」と思いますよね。
例えば…
- 健診データをクラスタリングして「メタボ予備軍グループ」を見つける
- 大量の患者さんのデータから「似ているタイプ」を分類する
要するに「隠れた仲間探し」に強いんです。
まとめ
教師なし学習は「正解のない世界でパターンを見つける力」。
最初は不安かもしれませんが、看護師や保健師の現場って実は「正解がない中で動く」ことが多いですよね。
正解が見つからない時は、「グループ分け」して考えた方がうまく事が進むことがあるかもしれませんよ。
今回はここまで。またお会いしましょう!!
