分析手法完全ガイド

t検定とは？2グループの平均差・対応あり/なし・SPSSでのやり方までやさしく解説

Q: 対応のあるt検定と対応のないt検定はどう見分けますか？

同じ対象を2回測ったデータなら対応あり、別々の対象どうしを比べるなら対応なしです。データのとり方で決まります。

Q: 正規分布でなくてもt検定は使えますか？

データの数が十分（各グループ30以上が目安）あれば中心極限定理により多少のずれは問題になりにくいです。データが少なく正規性も満たせない場合はU検定に切り替えます。

Q: 等分散でないときはどうすればよいですか？

等分散を仮定しないWelchのt検定を使います。SPSSは等分散を仮定する行としない行の両方を出力します。

Q: 3つ以上のグループを比べたい場合は？

t検定は2グループ専用です。3つ以上を比べたいときは分散分析（ANOVA）を使います。

Q: t値が大きいほど良いのですか？

t値の絶対値が大きいほど平均の差が偶然では説明しにくいことを示します。良し悪しではなく差の有無を判断する指標で、差の大きさは効果量で見ます。

Q: 効果量はなぜ必要ですか？

p値は差の有無しか教えてくれず、データが多いと小さな差でも有意になります。Cohen's dなどの効果量で差の大きさを示します。

Q: t値がマイナスになったのですが、どう解釈すればよいですか？

符号はどちらのグループを先に置いたかで決まるだけです。判断には絶対値を使い、どちらの平均が高かったかは平均値とあわせて文章で明記します。

Q: p値が0.05をわずかに超えたときは「差がない」と書いてよいですか？

言い切るのは不正確です。「有意な差は認められなかった」と書き、効果量や信頼区間、サンプルサイズの限界もあわせて述べます。

Q: 1標本t検定はどんなときに使いますか？

1グループの平均を既知の基準値（全国平均や規格値など）と比べるときに使います。比べる相手が決まった値である点が2標本t検定との違いです。

Q: Excelでもt検定はできますか？

T.TEST関数や分析ツールでp値を求められます。ただし正規性・等分散のチェックや効果量の算出は自動では行われません。

読了の目安約13分 難易度はじめての方OK 最終更新2026.07.02

t検定とは、2つのグループの平均値の差が、偶然の範囲を超えた意味のある差かどうかを判定する検定です。平均の差を標準誤差で割ったt値の大きさから、p値を使って判断します。

みなさん、こんにちは。スマート・アナリティクスの畠です。 t検定は、2つのグループの「平均値」に意味のある差があるかを調べる、もっとも基本的な検定のひとつです。「新しい指導法を受けたクラスと受けていないクラスで、テストの平均点に差があるか」といった比較に使います。このページでは、t検定の3つの種類、平均の差を測る仕組み、前提条件、結果と効果量の読み方、U検定との使い分けまでを、つまずきやすいところを先回りしながら順番に解説します。

畠

畠慎一郎スマート・アナリティクス株式会社代表取締役経営学修士を取得後、統計解析ソフトウェアのSPSS社に入社。IBM社のSPSS社買収に伴い日本アイ・ビー・エム株式会社に入社し、SPSS製品をはじめとするデータ分析・ビジネス・アナリティクス製品の製品マーケティング・戦略立案を担当。2015年よりセールスフォース・ドットコムにて現在のEinstein Analytics（旧 Wave Analytics）の日本市場における製品責任者として参画。2019年3月より現職。著書『武器としてのデータ分析力』『SPSS超入門』『文系ビジネスパーソンのためのデータ分析入門』。総務省統計局「社会人のためのデータサイエンス講座」講師も務める。

このページの要点

t検定は、2つのグループの「平均値」に意味のある差があるかを調べる検定
3種類ある。1標本t検定／対応のない2標本t検定／対応のある（対応）t検定
平均の差を、データのばらつき（標準誤差）で割って「差の大きさ」を測る
正規性が前提。満たせないときはマン・ホイットニーのU検定に切り替える

このページの目次開く / 閉じる ▾

t検定で何が分かるのか
t検定の3つの種類
t検定の仕組み──平均の差を標準誤差で割る
前提条件──正規性と等分散
結果の読み方──t値・自由度・p値
効果量──差の大きさを示す
U検定との使い分け
t検定をもう一歩深く──t分布・片側両側・論文での書き方
SPSSでの実行
関連分析手法・SPSS実装ガイド
つまずきやすいポイントと注意点
よくある質問

t検定で何が分かるのか

t検定が答えてくれるのは、「2つのグループの平均値に、偶然では説明しにくい差があると言えるか」という問いです。

2つのグループの平均が違っていても、それがたまたまなのか、それとも本当に差があるのかは、平均の値だけでは判断できません。データにはばらつきがあるからです。t検定は、平均の差とデータのばらつきを合わせて見ることで、その差が「意味のある差」と言えるかを統計的に判断します。

ここがポイント
t検定が見るのは「平均の差」そのものではなく、「ばらつきに対して、その差がどれくらい大きいか」です。差が同じでも、ばらつきが小さければ意味のある差になりやすく、大きければなりにくい、と考えてください。

t検定の3つの種類

t検定には、データのとり方に応じて3つの種類があります。まず自分のデータがどれにあたるかを見分けることが、最初の一歩です。

種類	何を比べるか	例
1標本t検定	1つのグループの平均を、ある基準値と比べる	あるクラスの数学の平均点が、全国平均の60点と言えるか
対応のない2標本t検定	独立した2つのグループの平均を比べる	A組とB組で、テストの平均点に差があるか
対応のある（対応）t検定	同じ対象の2回の測定値を比べる	同じ生徒の、講習の前と後でテストの点数に差があるか

とくに混同しやすいのが「対応のない」と「対応のある」の区別です。別々の人（対象）どうしを比べるなら対応なし、同じ人を2回測ったなら対応あり。ここを取り違えると、検定そのものが変わってしまうので注意してください。

t検定の仕組み──平均の差を標準誤差で割る

t検定の中心にあるのが、検定統計量「t値」です。考え方はシンプルで、平均の差を、その差のばらつき（標準誤差）で割ったものです。

t ＝（グループ1の平均 − グループ2の平均）÷ 差の標準誤差

分子は「平均がどれだけ離れているか」、分母は「その差がどれくらいぶれうるか」です。平均の差が大きく、ばらつきが小さいほど、t値は大きくなります。t値が大きいほど、「偶然では説明しにくい差」だと判断できます。

標準誤差は、データのばらつき（標準偏差）とデータの数から決まります。同じ平均差でも、データの数が多いほど標準誤差は小さくなり、差を検出しやすくなります。

前提条件──正規性と等分散

t検定にはいくつかの前提があります。前提が崩れていると、結論を誤りやすくなります。

各グループのデータが正規分布に近いこと：ただし、中心極限定理により、データの数が十分（目安として各グループ30以上）あれば、多少のずれは大きな問題になりません。
2つのグループの分散が等しいこと（等分散）：対応のない2標本t検定の前提です。等分散が満たせないときは、Welch（ウェルチ）のt検定を使います。
観測が互いに独立していること：対応のない検定では、2つのグループが別々の対象であること。

ワンポイント
等分散かどうかは、SPSSがレーベン検定で自動的に確かめてくれます。最近は、等分散を仮定しないWelchのt検定を最初から使う考え方も広まっています。迷ったらWelchを選んでおくと安全です。

結果の読み方──t値・自由度・p値

t検定の出力では、t値・自由度・p値（有意確率）の3つを読みます。t値と自由度から計算されるのがp値です。

p値が有意水準（ふつうは0.05）を下回れば、「2つのグループの平均に、統計的に意味のある差がある」と判断します。p値が0.05以上なら「有意な差があるとは言えない」となりますが、これは「差がないことが証明された」という意味ではありません。データが少なくて差を検出できなかっただけ、という可能性もあります。

効果量──差の大きさを示す

p値は「差があるか／ないか」を教えてくれますが、「差がどれくらい大きいか」は教えてくれません。データが多いと、ごくわずかな差でも有意になるので、効果量を書き添えるのが、いまの標準的な書き方です。

t検定の効果量としては、Cohen's d（コーエンのd）がよく使われます。平均の差を標準偏差で割った値で、目安は次のとおりです。

Cohen's d	差の大きさ（目安）
0.2 前後	小さい差
0.5 前後	中くらいの差
0.8 以上	大きい差

レポートや論文では「t(38) = 2.45, p < .05, d = 0.79」のように、t値（カッコ内は自由度）・p値・効果量をセットで示すのが基本の形です。

SPSSでの実際の操作は「使い方」シリーズで

本ガイドは考え方の解説です。SPSS画面でのt検定の手順は連載でていねいに紹介しています。

SPSSの使い方シリーズ →

U検定との使い分け

t検定の前提（正規性）が満たせないとき、頼りになるのがマン・ホイットニーのU検定です。2つの手法は、対にして覚えると使い分けに迷いません。

観点	t検定	マン・ホイットニーのU検定
種類	パラメトリック検定	ノンパラメトリック検定
正規性の前提	必要	いらない
比べるもの	平均値	順位（分布の位置）
向いている場面	正規分布に近く、データも十分あるとき	正規性が満たせない、データが少ない、外れ値があるとき

基本の判断は「前提が満たせるならt検定、満たせないならU検定」です。データが間隔・比率尺度で、各グループが正規分布に近く、数も十分あるなら、検出力の高いt検定が向きます。

t検定をもう一歩深く──t分布・片側両側・論文での書き方

ここからは、基本を押さえた方向けに、もう一歩だけ踏み込んだ内容をまとめます。論文や研究レポートでt検定を実際に使うときに、かならずと言っていいほど出てくるテーマばかりです。独学ではさらっと流れて戸惑いやすいところでもあるので、先回りして整理しておきますね。

t分布と自由度──なぜ正規分布をそのまま使わないのか

t値が従う分布は、正規分布ではなく「t分布」と呼ばれる分布です。形は正規分布によく似た左右対称の山ですが、すそ（端のほう）が少し厚くなっています。なぜ正規分布をそのまま使わないのかというと、母集団の標準偏差が分からないため、標本から推定した標準偏差で代用しているからです。推定値には誤差が混ざりますから、その分だけ「極端な値も出やすい」と見込んでおく必要がある──これが、すそが厚くなる理由です。

t分布の形は自由度（df）で決まります。自由度は、おおまかに言えば「自由に動ける情報の数」のことで、対応のない2標本t検定なら n₁ + n₂ − 2、対応のあるt検定ならペア数 − 1 です。自由度が大きくなる、つまりデータが増えるほどt分布は正規分布に近づき、自由度が30を超えるあたりからは、ほとんど見分けがつかなくなります。「データが多いほど推定が安定する」という直感どおりの性質です。

片側検定と両側検定──迷ったら両側

検定には、「差があるか」だけを問う両側検定と、「Aのほうが大きいか」のように方向まで指定する片側検定があります。片側検定は同じデータでもp値が半分になるため有意になりやすいのですが、そのぶん使ってよい場面が限られます。データを見る前から、理論や先行研究にもとづいて方向を断言できるときだけです。

結果を見てから「予想どおりAが大きかったので片側で」と切り替えるのは、後出しじゃんけんにあたるのでやってはいけません。論文や研究レポートでは、特別な理由がない限り両側検定を選び、その旨を明記しておくのが安全です。SPSSの出力も、既定では両側のp値が表示されます。

t検定とz検定の違い

教科書では、t検定の前にz検定が出てくることがあります。z検定は母集団の標準偏差が「分かっている」ときに正規分布で判定する方法、t検定はそれが「分からない」ときに標本から推定して判定する方法です。実際の研究で母集団の標準偏差が事前に分かっていることはまずありませんから、実務で使うのはほぼt検定だけと考えて差し支えありません。データが多いときは、両者の結果はほとんど一致します。

論文・レポートでの結果の書き方

t検定の結果は、t値・自由度・p値・効果量をセットで報告するのが基本です。心理学系を中心に広く使われるAPAスタイルでは、たとえば次のように書きます。

t(58) = 2.31, p = .024, d = 0.60

日本語の文章にするなら、「新しい指導法のクラス（M = 72.4, SD = 8.2, n = 30）と従来のクラス（M = 67.1, SD = 9.5, n = 30）の平均点を対応のないt検定で比較したところ、有意な差が認められた（t(58) = 2.31, p = .024, d = 0.60）」のような形です。平均（M）と標準偏差（SD）、各グループの人数（n）も忘れずに添えてください。

等分散が満たせずWelchのt検定を使った場合は、自由度が小数になります（例：t(52.3) = 2.28）。小数のままで構いません。むしろ自由度が小数であることが「Welchを使った」というサインになるので、四捨五入して整数にしないでくださいね。

サンプルサイズの目安と検出力

「何人くらい集めればいいですか？」は、ご相談でもっともよくいただく質問のひとつです。答えは「見込む差の大きさによる」のですが、目安として、中くらいの差（d = 0.5）を有意水準5%（両側）・検出力80%で検出するには、各グループ約64人が必要です。大きな差（d = 0.8）なら各グループ約26人で足りますが、小さな差（d = 0.2）になると各グループ約394人まで増えます。

研究の計画段階であれば、先行研究の効果量を手がかりに、G*Powerなどの無料ソフトで必要数を見積もっておくと、「集めてみたけれど人数が足りず有意にならなかった」という残念な事態を避けやすくなります。

SPSSでの実行

IBM SPSS Statistics では、「分析」→「平均の比較」から、1サンプルのt検定・独立したサンプルのt検定・対応のあるサンプルのt検定をそれぞれ選べます。検定変数とグループ変数を指定して実行します。

独立したサンプルのt検定では、出力にレーベンの等分散検定が併記され、「等分散を仮定する」行と「仮定しない」（Welch）行の両方が表示されます。レーベン検定が有意なら、等分散を仮定しない行を読みます。効果量は出力されないことがあるので、別に求めます。SPSSの具体的な画面操作は「SPSSの使い方」シリーズでくわしく解説しています。

t検定と関連の深い分析手法・SPSSでの具体的な実装手順を以下にまとめます。研究設計や論文執筆の参考にあわせてご活用ください。

つまずきやすいポイントと注意点

「対応あり」と「対応なし」を取り違えない
同じ人を2回測ったのに対応のない検定を使うと、結果が変わってしまいます。データのとり方をまず確認してください。

3つ以上のグループの比較には使えません。3グループ以上を一度に比べたいときは、分散分析（ANOVA）を使います。t検定をくり返すと、誤って有意と判定する確率が上がってしまいます。

有意でない＝差がない、ではありません。p ≥ 0.05 は「差があるとは言えない」であって、差がないことの証明ではありません。

効果量を省かないようにします。p値だけでなく、Cohen's d で差の大きさも示しましょう。

よくある質問

Q対応のあるt検定と対応のないt検定はどう見分けますか？▾

同じ対象を2回測ったデータ（講習の前と後など）なら対応あり、別々の対象どうしを比べるなら対応なしです。データのとり方で決まります。

Q正規分布でなくてもt検定は使えますか？▾

データの数が十分（各グループ30以上が目安）あれば、中心極限定理により多少のずれは問題になりにくいです。データが少なく正規性も満たせない場合は、マン・ホイットニーのU検定に切り替えます。

Q等分散でないときはどうすればよいですか？▾

等分散を仮定しないWelch（ウェルチ）のt検定を使います。SPSSは等分散を仮定する行としない行の両方を出力するので、レーベン検定の結果に応じて読み分けます。

Q3つ以上のグループを比べたい場合は？▾

t検定は2グループ専用です。3つ以上を比べたいときは分散分析（ANOVA）を使います。t検定をくり返すと、有意と誤判定する確率が上がってしまいます。

Qt値が大きいほど良いのですか？▾

t値の絶対値が大きいほど、平均の差が「偶然では説明しにくい」ことを示します。ただし良し悪しではなく、差の有無を判断するための指標です。差の大きさは効果量で見ます。

Q効果量はなぜ必要ですか？▾

p値は差の有無しか教えてくれず、データが多いと小さな差でも有意になります。Cohen's d などの効果量を添えると、差の大きさまで示せます。

Qt値がマイナスになったのですが、どう解釈すればよいですか？▾

符号は「どちらのグループを先に置いたか」で決まるだけなので、心配いりません。グループ1の平均がグループ2より小さければマイナスになります。判断には絶対値を使い、報告するときは「どちらが高かったか」を平均値とあわせて文章で明記すれば大丈夫です。

Qp値が0.05をわずかに超えたときは「差がない」と書いてよいですか？▾

「差がない」と言い切るのは正確ではありません。有意でなかったことは「差があるという十分な証拠が得られなかった」ことを意味するだけです。レポートでは「有意な差は認められなかった」と書き、効果量や信頼区間、サンプルサイズの限界もあわせて述べると誠実な報告になります。

Q1標本t検定はどんなときに使いますか？▾

手元の1グループの平均を、既知の基準値と比べたいときに使います。たとえば「自分のクラスの平均点が全国平均の60点と違うと言えるか」「製品の平均重量が規格値どおりか」といった場面です。比べる相手がもう1つのグループではなく「決まった値」である点が、2標本t検定との違いです。

QExcelでもt検定はできますか？▾

できます。T.TEST関数（引数で対応あり・等分散・Welchを指定）や、分析ツールの「t検定」でp値を求められます。ただし正規性や等分散のチェック、効果量の算出までは自動では行われないため、前提条件の確認から結果の解釈までを一度の流れで行いたい場合はSPSSのほうが手軽です。

Qt検定とカイ二乗検定はどう使い分けますか？▾

比べたいものが「平均」ならt検定、「カテゴリの件数の分かれ方」ならカイ二乗検定です。テストの平均点を2クラスで比べるならt検定、合格・不合格の人数の偏りを見るならカイ二乗検定、と覚えておくと迷いません。

SPSSの操作のコツは、無料の「小技Live」セミナーで

検定まわりの操作や出力の読み方のちょっとした技を、ライブ配信で無料紹介しています。体系的に学びたい方には手法別のオンライントレーニング講座もあります。

小技Live（無料）→

解析の進め方に迷ったら、専門家にご相談ください。

「自分のデータでどう使えばいい？」「論文のこの部分が不安」——統計解析の専門スタッフが個別にお答えします。

30分の無料オンライン相談

「自分のデータでどう使えばいい？」をお気軽にご相談ください

→