統計学超入門⑥|相関とは何か?「関係性」を見る統計的な考え方

1. 「相関がある」とは、どういう意味か

ニュースや論文、ビジネス資料で、次のような表現をよく目にします。

「AとBには相関がある」

何となく分かった気になりますが、ここで一度、立ち止まって考えてみましょう。

相関とは、具体的に何と何の関係を見ているのでしょうか?

相関とは、

2つの変数が、どの程度「一緒に動くか」

を見るための考え方です。

2. 相関は「因果」ではない

最初に、最も重要な注意点から確認します。

相関 ≠ 因果関係

これは統計学における、ほぼ最重要ルールです。

  • Aが増えるとBも増える

  • Aが減るとBも減る


    このような動きが見られても、

  • AがBの原因

  • BがAの原因

とは限りません。

あるいは、

  • 第3の要因Cが、AとBの両方に影響している

可能性もあります。相関はあくまで、

「一緒に動いているかどうか」を測る指標

にすぎません。

3. 相関が見ているのは「分布の形」

第5回で、分布を見る重要性を学びました。

相関もまた、分布を前提とした考え方です。

具体的には、

  • 横軸に変数X

  • 縦軸に変数Y


    を取った 散布図 を想像してください。

相関とは、

この点の集まりが、どれくらい一直線に近いか

を数値化したものです。

4. 正の相関・負の相関・無相関

正の相関

  • Xが大きくなると

  • Yも大きくなる傾向がある

右上がりの関係です。

例:

  • 勉強時間とテスト得点

  • 広告費と売上

負の相関

  • Xが大きくなると

  • Yは小さくなる傾向がある

右下がりの関係です。

例:

  • 気温と暖房使用量

  • 価格と需要量

無相関

  • XとYの間に

  • 一貫した動きが見られない


    点がバラバラに散らばっている状態です。

重要なのは、

無相関=関係がない
とは限らない

という点です。

「直線的な関係がない」だけで、曲線的な関係が隠れていることもあります。


5. 相関係数とは何か

相関を数値で表したものが、相関係数です。

最もよく使われるのが、ピアソンの積率相関係数です。

  • −1 〜 +1 の範囲をとる指標

    です。
  • +1 に近い → 強い正の相関

  • −1 に近い → 強い負の相関

  • 0 に近い → 直線的な関係が弱い

ここで大切なのは、

「強さ」と「方向」を同時に表している

という点です。

6. 相関係数を見るときの注意点

相関係数は便利ですが、単独で信じてはいけません。

注意①:必ず散布図を見る

同じ相関係数でも、

  • きれいな直線

  • 外れ値に引っ張られた関係

  • 途中で折れ曲がる関係

    など、状況は大きく異なります。

数値を見る前に、形を見る

これが統計の基本動作です。

注意②:範囲が狭いと相関は弱く見える

データの範囲が狭いと、

  • 本来は関係があっても

  • 相関係数が小さく出る

    ことがあります。

これは「測定の失敗」ではなく、データ条件の問題です。

7. なぜ相関は重要なのか

相関は、

  • 仮説を立てる

  • モデルを作る

  • 次の分析に進む

ための 入口 です。研究では、

  • 「どの変数を説明変数にするか」

ビジネスでは、

  • 「どこに手を打てば効果が出そうか」

を考える際に、相関は強力なヒントになります。

ただし、

相関は答えではなく、問いを生む道具

であることを忘れてはいけません。

8. 次回へのつながり

次回・第7回では、

  • 仮説とは何か

  • なぜ「検証する」という発想が必要なのか

を扱います。相関で見つけた「関係性」を、

それは偶然か?
それとも意味のある差なのか?

と問い直す。

ここから、推測統計の世界に本格的に入っていきます。

第6回のまとめ

  • 相関は「2つの変数が一緒に動く度合い」を見る

  • 相関は因果関係を意味しない

  • 相関は分布(散布図)を前提に理解する

  • 数値だけでなく、必ず形を見る

  • 相関は分析の出発点であり、結論ではない

ここまで来ると、統計は「数字の操作」ではなく問いを洗練させる道具だと見えてきます。

次回、第7回で「仮説を検証する」という統計の核心に進みましょう。