統計学超入門⑦|仮説を検証するという発想:統計的判断の基本
1. なぜ「仮説」を立てるのか
第6回では、相関という考え方を学びました。
相関を見ると、しばしば次のように感じます。
「関係がありそうだ」
「違いがありそうだ」
しかし、ここで統計は一歩立ち止まります。
それは、本当に意味のある違いなのか?
それとも、たまたまそう見えているだけなのか?
この問いに答えるために登場するのが、
仮説を検証するという発想です。
2. 仮説とは「世界を2つに分ける宣言」
統計における仮説とは、
データを見る前に立てる、
判断の基準となる主張
です。
ここで重要なのは、仮説は「正しそうな意見」ではない、という点です。
統計では、世界を次の2つに分けます。
帰無仮説(H₀)
「差はない」「効果はない」「関係はない」
という立場。
平均に差はない
処置の効果はない
相関はゼロである
という、慎重な仮説です。
対立仮説(H₁)
「差がある」「効果がある」「関係がある」(厳密には差がないとはいえない)
という立場。私たちが「本当はそうであってほしい」仮説は、多くの場合こちらです。
3. なぜ「差がない」から始めるのか
ここで、多くの人が疑問に思います。
なぜ「差がある」ではなく、「差がない」を基準にするのか?
理由はシンプルです。
「何も起きていない」という状態のほうが、より安全で疑いにくいから
統計は、疑いにくい仮説をまず置き、それをデータで崩せるかを見るという姿勢を取ります。
これは研究でも、ビジネスでも、意思決定のリスクを下げる考え方です。
4. 検証とは「確率で判断する」こと
仮説は、「正しいか・間違っているか」で判断しません。
統計が問うのは、次の一点です。
帰無仮説が正しいとしたら、
今回のデータはどれくらい起こりにくいか?
もし、
「めったに起こらない」
のであれば、
帰無仮説は疑わしい
と判断します。
これが、確率にもとづく判断です。
5. p値とは何か(直感的理解)
ここで登場するのが、p値です。
p値とは、
帰無仮説が正しいと仮定したときに、
今回と同じか、それ以上に極端な結果が
得られる確率
を表します。
重要なのは、
p値は「仮説が正しい確率」ではない
という点です。
p値はあくまで、
データがどれくらい珍しいか
を示す指標です。
6. 有意とは「偶然では説明しにくい」
統計ではよく、
「有意である」
「有意ではない」
という表現が使われます。
これは、
大きい
重要
意味がある
という日常語とは異なります。
統計における「有意」とは、
偶然だけでは説明しにくい
という、非常に限定的な意味です。
有意水準という考え方
多くの場合、
5%(0.05)
という基準が使われます。
これは、
「100回に5回くらいなら、
たまたまでも起こりうる」
というラインです。それより珍しければ、
偶然ではなさそうだ
と判断します。
7. 検定は「決断のための道具」
統計的検定は、
真理を証明する
正解を示す
ものではありません。役割はただ一つです。
不確実な状況で、
一定のルールにもとづいて
判断を下すこと
研究では、
論文として主張してよいか
ビジネスでは、
意思決定に進んでよいか
を支えるための道具です。
8. 次回へのつながり
次回・第8回では、
検定結果をどう読むのか
p値をどう解釈すべきか
を扱います。
「有意だった/有意でなかった」
その一言の裏に、
何が含まれていて、
何が含まれていないのか。
ここを誤解しないことが、
統計リテラシーの分水嶺になります。
第7回のまとめ
仮説とは、判断基準を事前に決めること
統計は「差がない」という仮説から始める
検証は確率にもとづく判断
p値は「データの珍しさ」を表す
有意とは「偶然では説明しにくい」という意味
ここまで来れば、統計はもう「数字の儀式」ではありません。
次回、第8回で検定結果との正しい付き合い方を学びましょう。

