突然ですが…あなたは「統計ツール」に苦手意識はありませんか?
「え、なんか数字ゴリゴリで難しそう…聞いただけで蕁麻疹出るわ」
「昔授業で出てきたけど、正直よくわからなかった…」
そんな声が聞こえてきそうです。安心してください、私も最初はそうでした。
でも実は、使いやすくて、独学しやすくて、しかも無料のツールもあるんです!
今回は、「自分でデータ分析がしたいから、統計に役立つツールを知りたい!」という保健師さんの声にお応えして、私が調べたり実際に使ったりした統計ツールを、ゆる〜く比較紹介してみます。
皆さんのパートナーを、是非とも探してみてくださいね。
Excel
「は??なめとんの??Excelくらい知っとるわ!!ダボが!!」
ちょっと待って、まだブラウザを閉じないでください!!
念の為、皆さんにとって一番馴染み深いであろうExcelについて解説しておきましょう。プログラミングをやっている私も未だにお世話になっていますからね。
ピボットテーブルや関数を駆使すれば、簡単な集計やグラフなら十分対応可能です。
t検定など、Excelだけで行うことができる検定もあります。ありがてぇ。
ただし、一部の検定をやろうとすると結構無理があります。
私のブログでもExcelで検定をする方法を紹介していますが、どうしても近似値しか出せない検定もあります。
それに、後述する他のツールを知っているとExcelの分析は割と手間です。
「最初の一歩」にはいいけど、「分析の森」に進むには力不足かもしれません。
HAD
主に心理統計分析を行うためのExcel VBAを使ったフリープログラムです。
Excelをベースで動かすことができるため、Excelに慣れている人なら比較的使いやすいです。
しかもExcelだけでは手が届かなかった分析もできます。
「Excelファイルをポンとアップ → すぐ結果が出た!」と操作が簡単なのが嬉しいです。
こんなに高性能なのに、無料です!!
いいんですかこんな高性能なものを無料で使わせてもらって。
ただし、計算速度が遅いのが玉に瑕。
大きすぎるデータや本格的なデータ分析については、後に紹介するプログラムの方が軍配が上がります。
また、「HADの計算結果は、一応SPSSやSASと結果が一致することは確認しています。しかし、 常に完全に信頼できるものとは限りません。」と開発者の清水裕士先生がおっしゃっています。(参照はこちら。)
Excelを使った後、もう少し本格的な分析がしてみたいな〜という方にはぴったりなのではないでしょうか。
R(アール)
Rは「元祖・統計専門ツール」です。論文にもよく登場します。
ツシマのゼミの先生もRを使っていました。
特に生存分析・ロジスティック回帰・疫学研究にはピッタリ。
統計学の理論に基づいた結果を得やすいです。
医療系のサンプルも多くて、大学や研究機関でも現役バリバリです。
古くから医療系の研究を支えてきた実績があるRを味方にできれば、安心ですね。
見た目や操作性がちょっと渋いのが玉にキズですが、統計で本格派を目指すならアリです!
プログラミング、ちょっとやってみたいかも…という方は、一度挑戦してみては?
Rは無料で使えるので、試しに使うにはもってこいです。
Python(パイソン)
ヘビのマークが特徴的なPython。
味方につければ非常に強力です。
ツシマのデータ分析を支えてくれているのはこのPythonです。
回帰分析、クロス集計、生存分析はお手のもの。
グラフもExcelより細かいカスタマイズができます。
(Rでもグラフを作れますが、どちらを使うかはお好みで。)
それに…PythonはRよりも機械学習・ディープラーニングに強いです。
「この人は将来、生活習慣病になる可能性が高いかどうか?」
「どんな条件の人が健診で再検査になりやすいか?」
などなど、このような予測や分類をデータから自動的に学習させることもできます。
データサイエンス界のスーパースターなのにも関わらず、無料で使えます。
これが無料で使えるって正気かよ。
ただし、Rと同様、使うにはプログラミングを勉強する必要があります!!
しかし、ツシマはプログラミングスクールに通わずに勉強したので、独学はできなくはないです。
データ分析も機械学習もやってみたい!という欲張りなあなたにはおすすめです。
JMP(ジャンプ)
ボタンぽちぽちで解析できる、操作の王様です。
直感的にデータ分析ができるのは嬉しいですね。
図式化だって簡単。
企業の製品企画開発部門や品質管理部門、データ分析担当者や医師、大学および公共の教育、研究機関などで使われてきました。大いに実績あり。
ただし、値段が可愛くないです。
2025年7月時点で、一番安いものでも、年間価格は139000円です。
こんなにお金があったらゲームに課金し放題だよ!!
大学の研究室や職場にあれば、ぜひ触ってみてはいかがでしょうか。
SAS(サス)
SASは、病院や大学・行政機関などで長年使われてきた伝統のある統計ソフトです。
保健指導や疫学研究、医療ビッグデータ分析では今でも重宝されています。
分析の精度はピカイチです。
コードを書く必要がありますが、他のプログラミング言語よりはわかりやすく操作しやすいという声もあります。
ただし、こちらも高額です。個人で使うのはお勧めしません。
製品版でおよそ600,000円〜くらい。
車買えるわ。
研究室や職場にあったら使おう、くらいのノリでOKです。
SASについては、詳しい記事があるのでこちらもご参照ください。
SPSS(エスピーエスエス)
ツシマのかつての相棒です。大学生の頃卒業研究でお世話になりました。
今はさよならバイバイしてしまいましたが…
SPSSは大学生の卒業研究で使われるくらいなので、操作性は抜群です。
今のようにプログラミング知識がなかった頃のツシマでも操作できました。
ロジスティック回帰やt検定もすぐできます。
ただし、こちらもやはり値段が可愛くない。
サブスクで12000円/月〜なので、人によっては払えなくもなさそうですが、結構痛手ですね。
こちらも「職場や大学にあったら使おう!!」くらいでOKです。
まずは試してみよう
以上、統計ソフト・ツールのまとめでした。
皆さんのパートナーになれそうな統計ソフトは見つかりましたか?
ここで、(ツシマによる独断と偏見入りの)まとめを載せます。
| ツール名 | コスト | 習得しやすさ | 初心者向け | 高度分析 | 操作性 | コメント |
| Excel | (基本)無料 | ★★★★★ | ◎ | × | ◎ | 入門には最適だが限界あり |
| HAD | 無料 | ★★★★★ | ◎ | △ | ◎ | 入門の次におすすめ! |
| R | 無料 | ★★★☆☆ | △ | ◎ | △ | プログラミングOKなら最強 |
| Python | 無料 | ★★★☆☆ | △ | ◎ | △ | 統計も機械学習もできる |
| JMP | 高額 | ★★★★☆ | ◎ | ◎ | ◎ | 触って楽しい統計ツール |
| SAS | 高額 | ★★★☆☆ | △ | ◎ | △〜◎ | 医療現場で信頼のレジェンド |
| SPSS | 高額 | ★★★★☆ | ◎ | ◯〜△ | ◎ | 「高度すぎない範囲」であれば十分対応可能 |
まずは使ってみないと始まらないので、「これを使ってみたい!」というものがあればぜひ試してください。
また、「やっぱり自分で分析するのは難しいよ〜〜」という方はツシマがデータ分析・グラフ作成をお手伝いできるので、是非ココナラでご依頼ください。
まずは無料相談でもOK! お気軽にどうぞ!!!
ではでは、楽しいデータ分析ライフを!!
