分析手法 完全ガイド

カイ二乗検定とは?クロス集計の関連を調べる方法をやさしく解説

読了の目安約12分 難易度はじめての方OK 最終更新2026.05.24

みなさん、こんにちは。スマート・アナリティクスの畠です。 カイ二乗検定(χ²検定)は、性別・部活の有無・満足度のランクといった「カテゴリ(質的)データ」を対象に、グループのあいだに関連や偏りがあるかを調べる検定です。アンケートの集計表からよく使われる、なじみ深い手法です。このページでは、カイ二乗検定の種類、観測度数と期待度数という考え方、カイ二乗値と自由度、結果と効果量の読み方、使うための前提条件までを、つまずきやすいところを先回りしながら順番に解説します。

畠 慎一郎
畠 慎一郎 スマート・アナリティクス株式会社 代表取締役 統計解析ソフトの提供と分析のサポートを通じて、研究や学習でデータ分析につまずく場面をたくさん見てきました。このガイドでも、わかりにくいところをやさしく解説していきます。
このページの要点
  • カイ二乗検定は、カテゴリ(質的)データの「関連」や「偏り」を調べる検定
  • 代表は2つ。独立性の検定(2変数に関連があるか)と適合度検定(理論の比に合うか)
  • 「実際に観測した度数」と「関連がないと仮定したときの期待度数」のズレの大きさを見る
  • 期待度数が小さいセル(5未満)が多いと使えない。そのときはフィッシャーの正確確率検定

カイ二乗検定で何が分かるのか

カイ二乗検定が答えてくれるのは、「カテゴリで分けたグループのあいだに、関連や偏りがあると言えるか」という問いです。たとえば「文系と理系で、統計が好きと答えた割合に差があるか」「アンケートの回答が、年代によってかたよっているか」といった比較に使います。

t検定や分散分析が数値(量的データ)の平均を比べるのに対し、カイ二乗検定は性別・部活の有無・満足度のランクといったカテゴリデータの「件数(度数)」を扱います。集計表(クロス集計表)があれば計算できるので、アンケート分析でとくによく登場します。

ここがポイント
カイ二乗検定が比べるのは「平均」ではなく「件数の分かれ方」です。数値の大小ではなく、カテゴリへの振り分け方にかたよりがあるかを見る検定だと考えてください。

2種類のカイ二乗検定

カイ二乗検定と一口に言っても、目的によって主に2つの種類があります。

種類何を調べるか
独立性の検定2つのカテゴリ変数のあいだに関連があるか文系・理系と統計の好き嫌いに関連があるか
適合度検定観測された分布が、理論的に期待される比に合っているかサイコロの目が均等に出ているか

研究やアンケート分析でよく使うのは独立性の検定です。このページでも、独立性の検定を中心に解説していきます。仕組みは適合度検定もほとんど同じです。

独立性の検定の考え方──観測度数と期待度数

独立性の検定の考え方は、とてもシンプルです。「もし2つの変数にまったく関連がなかったら、各マスの件数はこうなるはず」という期待度数を計算し、それを実際に観測した度数(観測度数)と比べます。

たとえば、文系・理系の学生それぞれに、統計が好きかどうかをたずねて集計したとします。

観測度数統計が好き好きではない合計
文系4060100
理系2080100
合計60140200

期待度数は、「文系か理系か」と「統計が好きかどうか」が無関係だと仮定して、行と列の合計から計算します。

期待度数 = (その行の合計 × その列の合計)÷ 全体の合計

たとえば「文系 × 統計が好き」のマスの期待度数は、100 × 60 ÷ 200 = 30 です。実際の観測度数は40なので、関連がないと仮定したときより10件多い、ということになります。このような観測度数と期待度数のズレが、すべてのマスで小さければ「関連があるとは言えない」、大きければ「関連がありそうだ」と判断します。

カイ二乗値と自由度

観測度数と期待度数のズレを、ひとつの数値にまとめたものがカイ二乗値(χ²)です。

χ² = Σ (観測度数 − 期待度数)² ÷ 期待度数

それぞれのマスで「ズレを二乗して期待度数で割った値」を求め、すべて合計します。ズレが大きいほどカイ二乗値は大きくなり、関連が強いことを示します。

あわせて必要になるのが自由度です。クロス集計表の自由度は、次の式で決まります。

自由度 df = (行数 − 1)×(列数 − 1)

2行2列の表なら df = (2−1)×(2−1) = 1 です。カイ二乗値は、この自由度に応じた基準(カイ二乗分布)と照らして、p値を求めます。

結果の読み方──p値

p値が有意水準(ふつうは0.05)を下回れば、「2つの変数のあいだに、統計的に意味のある関連がある」と判断します。p値が0.05以上なら「関連があるとは言えない」となりますが、これは「関連がないことが証明された」という意味ではない点に注意してください。

気をつけたいこと
カイ二乗検定が教えてくれるのは「関連があるかどうか」だけで、「どのマスが効いているか」までは分かりません。どのセルが偏りを生んでいるかを知りたいときは、調整済み残差(標準化残差)を併せて見ます。

効果量──関連の強さも示す

p値は「関連があるか/ないか」を教えてくれますが、「関連がどれくらい強いか」は教えてくれません。データの数が多いと、ごく弱い関連でも有意になるので、効果量を書き添えるのが、いまの標準的な書き方です。

クロス集計表の効果量としては、クラメールのV がよく使われます。0から1の範囲をとり、1に近いほど関連が強いことを表します。

クラメールのV関連の強さ(目安)
0.1 前後弱い関連
0.3 前後中くらいの関連
0.5 以上強い関連

2行2列の表では、Vの代わりにφ(ファイ)係数が使われることもあります。レポートや論文では、カイ二乗値・自由度・p値とあわせて効果量を示します。

SPSSでの実際の操作は「使い方」シリーズで
本ガイドは考え方の解説です。SPSS画面でのクロス集計とカイ二乗検定の手順は連載でていねいに紹介しています。
SPSSの使い方シリーズ →

使う前の前提条件

カイ二乗検定にも、満たしておきたい前提があります。

  1. データが件数(度数)であること:割合やパーセントではなく、実際の人数・件数で集計します。
  2. それぞれの観測が独立していること:同じ人を二重に数えていない、対応のないデータであること。
  3. 期待度数が小さすぎないこと:目安として、期待度数が5未満のマスが全体の20%を超えないこと。2行2列の表では、すべてのマスで期待度数5以上が望まれます。
期待度数が小さいときは
期待度数が5未満のマスが多いと、カイ二乗検定の結果は信頼できません。その場合は、フィッシャーの正確確率検定を使います。SPSSは2行2列の表で自動的にフィッシャーの結果も出してくれます。

SPSSでの実行

IBM SPSS Statistics では、「分析」→「記述統計」→「クロス集計表」を選び、行と列の変数を指定します。「統計量」でカイ二乗にチェックを入れると、カイ二乗値・自由度・漸近有意確率(p値)が出力されます。「セル」で期待度数や調整済み残差の表示を、「統計量」でクラメールのV・φ係数を追加できます。

出力では、まず期待度数が5未満のマスがいくつあるかの注記を確認し、前提を満たしているかを見ます。2行2列の表ではフィッシャーの正確確率検定の結果も併記されます。SPSSの具体的な画面操作は「SPSSの使い方」シリーズでくわしく解説しています。

つまずきやすいポイントと注意点

関連 ≠ 因果
カイ二乗検定で関連が見つかっても、どちらが原因でどちらが結果かは分かりません。相関分析と同じく、関連の有無を示すだけだと考えてください。

パーセントではなく件数で計算します。クロス集計表は割合で見ることが多いですが、カイ二乗検定にかけるのは実際の件数です。

有意でも関連が強いとはかぎりません。データが多いと、ごく弱い関連でも有意になります。p値と効果量(クラメールのV)は必ず両方を確かめます。

対応のあるデータには使えません。同じ人の前後の変化(賛成→反対など)を見たいときは、マクニマー検定を使います。

よくある質問

Qカイ二乗検定とt検定は何が違いますか?
扱うデータが違います。t検定は数値(量的データ)の平均を比べますが、カイ二乗検定はカテゴリ(質的データ)の件数の分かれ方を調べます。「平均の差」を見たいならt検定、「カテゴリへの振り分けの関連」を見たいならカイ二乗検定です。
Q期待度数が5未満のマスがあると使えませんか?
期待度数5未満のマスが多いと結果が信頼できません。目安は「5未満のマスが全体の20%以下」です。それを超える場合や2行2列の表では、フィッシャーの正確確率検定を使います。
Qカイ二乗検定で因果関係は分かりますか?
分かりません。カイ二乗検定が示すのは「関連があるかどうか」だけで、原因と結果の向きは示しません。因果を主張するには、追加の検討が必要です。
Qどのマスが関連に効いているかを知るには?
調整済み残差(標準化残差)を見ます。絶対値がおおむね2を超えるマスは、期待度数からのズレが大きく、関連を生んでいるセルと読めます。
Q独立性の検定と適合度検定はどう違いますか?
独立性の検定は2つのカテゴリ変数に関連があるかを調べます。適合度検定は、観測された1つの分布が理論的な比(例:均等)に合っているかを調べます。仕組みはどちらも観測度数と期待度数のズレを見る点で共通です。
Q効果量はなぜ必要ですか?
p値は関連の有無しか教えてくれず、データが多いと弱い関連でも有意になります。クラメールのVなどの効果量を添えると、関連の「強さ」まで示せます。
わからないところは、いっしょに。
「自分のデータでどう使えばいい?」「卒論のこの部分が不安」——どんな小さなことでも、SPSS歴20年以上の畠がやさしくお手伝いします。
30分の無料オンライン相談
「自分のデータでどう使えばいい?」を畠に気軽にご相談ください