カイ二乗検定とは?クロス集計の関連を調べる方法をやさしく解説
みなさん、こんにちは。スマート・アナリティクスの畠です。 カイ二乗検定(χ²検定)は、性別・部活の有無・満足度のランクといった「カテゴリ(質的)データ」を対象に、グループのあいだに関連や偏りがあるかを調べる検定です。アンケートの集計表からよく使われる、なじみ深い手法です。このページでは、カイ二乗検定の種類、観測度数と期待度数という考え方、カイ二乗値と自由度、結果と効果量の読み方、使うための前提条件までを、つまずきやすいところを先回りしながら順番に解説します。
- カイ二乗検定は、カテゴリ(質的)データの「関連」や「偏り」を調べる検定
- 代表は2つ。独立性の検定(2変数に関連があるか)と適合度検定(理論の比に合うか)
- 「実際に観測した度数」と「関連がないと仮定したときの期待度数」のズレの大きさを見る
- 期待度数が小さいセル(5未満)が多いと使えない。そのときはフィッシャーの正確確率検定
カイ二乗検定で何が分かるのか
カイ二乗検定が答えてくれるのは、「カテゴリで分けたグループのあいだに、関連や偏りがあると言えるか」という問いです。たとえば「文系と理系で、統計が好きと答えた割合に差があるか」「アンケートの回答が、年代によってかたよっているか」といった比較に使います。
t検定や分散分析が数値(量的データ)の平均を比べるのに対し、カイ二乗検定は性別・部活の有無・満足度のランクといったカテゴリデータの「件数(度数)」を扱います。集計表(クロス集計表)があれば計算できるので、アンケート分析でとくによく登場します。
カイ二乗検定が比べるのは「平均」ではなく「件数の分かれ方」です。数値の大小ではなく、カテゴリへの振り分け方にかたよりがあるかを見る検定だと考えてください。
2種類のカイ二乗検定
カイ二乗検定と一口に言っても、目的によって主に2つの種類があります。
| 種類 | 何を調べるか | 例 |
|---|---|---|
| 独立性の検定 | 2つのカテゴリ変数のあいだに関連があるか | 文系・理系と統計の好き嫌いに関連があるか |
| 適合度検定 | 観測された分布が、理論的に期待される比に合っているか | サイコロの目が均等に出ているか |
研究やアンケート分析でよく使うのは独立性の検定です。このページでも、独立性の検定を中心に解説していきます。仕組みは適合度検定もほとんど同じです。
独立性の検定の考え方──観測度数と期待度数
独立性の検定の考え方は、とてもシンプルです。「もし2つの変数にまったく関連がなかったら、各マスの件数はこうなるはず」という期待度数を計算し、それを実際に観測した度数(観測度数)と比べます。
たとえば、文系・理系の学生それぞれに、統計が好きかどうかをたずねて集計したとします。
| 観測度数 | 統計が好き | 好きではない | 合計 |
|---|---|---|---|
| 文系 | 40 | 60 | 100 |
| 理系 | 20 | 80 | 100 |
| 合計 | 60 | 140 | 200 |
期待度数は、「文系か理系か」と「統計が好きかどうか」が無関係だと仮定して、行と列の合計から計算します。
たとえば「文系 × 統計が好き」のマスの期待度数は、100 × 60 ÷ 200 = 30 です。実際の観測度数は40なので、関連がないと仮定したときより10件多い、ということになります。このような観測度数と期待度数のズレが、すべてのマスで小さければ「関連があるとは言えない」、大きければ「関連がありそうだ」と判断します。
カイ二乗値と自由度
観測度数と期待度数のズレを、ひとつの数値にまとめたものがカイ二乗値(χ²)です。
それぞれのマスで「ズレを二乗して期待度数で割った値」を求め、すべて合計します。ズレが大きいほどカイ二乗値は大きくなり、関連が強いことを示します。
あわせて必要になるのが自由度です。クロス集計表の自由度は、次の式で決まります。
2行2列の表なら df = (2−1)×(2−1) = 1 です。カイ二乗値は、この自由度に応じた基準(カイ二乗分布)と照らして、p値を求めます。
結果の読み方──p値
p値が有意水準(ふつうは0.05)を下回れば、「2つの変数のあいだに、統計的に意味のある関連がある」と判断します。p値が0.05以上なら「関連があるとは言えない」となりますが、これは「関連がないことが証明された」という意味ではない点に注意してください。
カイ二乗検定が教えてくれるのは「関連があるかどうか」だけで、「どのマスが効いているか」までは分かりません。どのセルが偏りを生んでいるかを知りたいときは、調整済み残差(標準化残差)を併せて見ます。
効果量──関連の強さも示す
p値は「関連があるか/ないか」を教えてくれますが、「関連がどれくらい強いか」は教えてくれません。データの数が多いと、ごく弱い関連でも有意になるので、効果量を書き添えるのが、いまの標準的な書き方です。
クロス集計表の効果量としては、クラメールのV がよく使われます。0から1の範囲をとり、1に近いほど関連が強いことを表します。
| クラメールのV | 関連の強さ(目安) |
|---|---|
| 0.1 前後 | 弱い関連 |
| 0.3 前後 | 中くらいの関連 |
| 0.5 以上 | 強い関連 |
2行2列の表では、Vの代わりにφ(ファイ)係数が使われることもあります。レポートや論文では、カイ二乗値・自由度・p値とあわせて効果量を示します。
使う前の前提条件
カイ二乗検定にも、満たしておきたい前提があります。
- データが件数(度数)であること:割合やパーセントではなく、実際の人数・件数で集計します。
- それぞれの観測が独立していること:同じ人を二重に数えていない、対応のないデータであること。
- 期待度数が小さすぎないこと:目安として、期待度数が5未満のマスが全体の20%を超えないこと。2行2列の表では、すべてのマスで期待度数5以上が望まれます。
期待度数が5未満のマスが多いと、カイ二乗検定の結果は信頼できません。その場合は、フィッシャーの正確確率検定を使います。SPSSは2行2列の表で自動的にフィッシャーの結果も出してくれます。
SPSSでの実行
IBM SPSS Statistics では、「分析」→「記述統計」→「クロス集計表」を選び、行と列の変数を指定します。「統計量」でカイ二乗にチェックを入れると、カイ二乗値・自由度・漸近有意確率(p値)が出力されます。「セル」で期待度数や調整済み残差の表示を、「統計量」でクラメールのV・φ係数を追加できます。
出力では、まず期待度数が5未満のマスがいくつあるかの注記を確認し、前提を満たしているかを見ます。2行2列の表ではフィッシャーの正確確率検定の結果も併記されます。SPSSの具体的な画面操作は「SPSSの使い方」シリーズでくわしく解説しています。
つまずきやすいポイントと注意点
カイ二乗検定で関連が見つかっても、どちらが原因でどちらが結果かは分かりません。相関分析と同じく、関連の有無を示すだけだと考えてください。
パーセントではなく件数で計算します。クロス集計表は割合で見ることが多いですが、カイ二乗検定にかけるのは実際の件数です。
有意でも関連が強いとはかぎりません。データが多いと、ごく弱い関連でも有意になります。p値と効果量(クラメールのV)は必ず両方を確かめます。
対応のあるデータには使えません。同じ人の前後の変化(賛成→反対など)を見たいときは、マクニマー検定を使います。

