統計学超入門⑥|相関とは何か?「関係性」を見る統計的な考え方
1. 「相関がある」とは、どういう意味か
ニュースや論文、ビジネス資料で、次のような表現をよく目にします。
「AとBには相関がある」
何となく分かった気になりますが、ここで一度、立ち止まって考えてみましょう。
相関とは、具体的に何と何の関係を見ているのでしょうか?
相関とは、
2つの変数が、どの程度「一緒に動くか」
を見るための考え方です。
2. 相関は「因果」ではない
最初に、最も重要な注意点から確認します。
相関 ≠ 因果関係
これは統計学における、ほぼ最重要ルールです。
Aが増えるとBも増える
Aが減るとBも減る
このような動きが見られても、
AがBの原因
BがAの原因
とは限りません。
あるいは、
第3の要因Cが、AとBの両方に影響している
可能性もあります。相関はあくまで、
「一緒に動いているかどうか」を測る指標
にすぎません。
3. 相関が見ているのは「分布の形」
第5回で、分布を見る重要性を学びました。
相関もまた、分布を前提とした考え方です。
具体的には、
横軸に変数X
縦軸に変数Y
を取った 散布図 を想像してください。
相関とは、
この点の集まりが、どれくらい一直線に近いか
を数値化したものです。
4. 正の相関・負の相関・無相関
正の相関
Xが大きくなると
Yも大きくなる傾向がある
右上がりの関係です。
例:
勉強時間とテスト得点
広告費と売上
負の相関
Xが大きくなると
Yは小さくなる傾向がある
右下がりの関係です。
例:
気温と暖房使用量
価格と需要量
無相関
XとYの間に
一貫した動きが見られない
点がバラバラに散らばっている状態です。
重要なのは、
無相関=関係がない
とは限らない
という点です。
「直線的な関係がない」だけで、曲線的な関係が隠れていることもあります。
5. 相関係数とは何か
相関を数値で表したものが、相関係数です。
最もよく使われるのが、ピアソンの積率相関係数です。
−1 〜 +1 の範囲をとる指標
です。+1 に近い → 強い正の相関
−1 に近い → 強い負の相関
0 に近い → 直線的な関係が弱い
ここで大切なのは、
「強さ」と「方向」を同時に表している
という点です。
6. 相関係数を見るときの注意点
相関係数は便利ですが、単独で信じてはいけません。
注意①:必ず散布図を見る
同じ相関係数でも、
きれいな直線
外れ値に引っ張られた関係
途中で折れ曲がる関係
など、状況は大きく異なります。
数値を見る前に、形を見る
これが統計の基本動作です。
注意②:範囲が狭いと相関は弱く見える
データの範囲が狭いと、
本来は関係があっても
相関係数が小さく出る
ことがあります。
これは「測定の失敗」ではなく、データ条件の問題です。
7. なぜ相関は重要なのか
相関は、
仮説を立てる
モデルを作る
次の分析に進む
ための 入口 です。研究では、
「どの変数を説明変数にするか」
ビジネスでは、
「どこに手を打てば効果が出そうか」
を考える際に、相関は強力なヒントになります。
ただし、
相関は答えではなく、問いを生む道具
であることを忘れてはいけません。
8. 次回へのつながり
次回・第7回では、
仮説とは何か
なぜ「検証する」という発想が必要なのか
を扱います。相関で見つけた「関係性」を、
それは偶然か?
それとも意味のある差なのか?
と問い直す。
ここから、推測統計の世界に本格的に入っていきます。
第6回のまとめ
相関は「2つの変数が一緒に動く度合い」を見る
相関は因果関係を意味しない
相関は分布(散布図)を前提に理解する
数値だけでなく、必ず形を見る
相関は分析の出発点であり、結論ではない
ここまで来ると、統計は「数字の操作」ではなく問いを洗練させる道具だと見えてきます。
次回、第7回で「仮説を検証する」という統計の核心に進みましょう。

