t検定とは

t検定は、2つ(または1つ)の平均の差が「偶然のばらつき(サンプリング誤差)」だけで説明できる範囲かどうかを、確率モデルで評価する検定です。
本ページは操作手順ではなく、t検定が成立する理屈(t分布・自由度・標準誤差・誤差構造)を最優先で整理し、研究で迷わない判断軸を提供します。

SPSSでt検定を実行するには、IBM SPSS Statistics の基本機能(Statistics Base相当)で対応できます。SPSSの具体的な操作は「SPSSの使い方」をご覧ください。

t検定の本質:平均差を「確率的に」評価する

t検定は「平均が違うか」を見ているようで、実際には観測された平均差が、サンプリングの揺らぎだけで起こり得る範囲かを判定します。たとえば、2群の平均との差が0.8あったとしても、データが小さくばらつきが大きければ「その程度の差は偶然でも起きる」と判断され得ます。逆に差が小さくても、ばらつきが小さくサンプルが多ければ「偶然では説明しにくい」と判断され得ます。

つまりt検定が比較しているのは、単なる差ではなく、差 ÷(差の標準誤差)という「差の大きさを不確実性で規格化した指標」です。ここが理解できると、後段の「独立サンプル」「対応サンプル」で何が変わるかが一気に見通せます。

なぜt分布が必要なのか:母分散未知の世界

平均の差を評価するには、本来「平均との差がどれくらい揺れるか(標準誤差)」が必要です。もし母分散(母標準偏差)が既知なら、平均との差は正規分布で標準化でき、Z検定で話が終わります。しかし実際の研究では、母分散は未知であり、標準誤差は標本から推定した標準偏差を使って近似します。

ここで生じるのが「標準誤差そのものが推定値で揺れる」という追加の不確実性です。この不確実性を織り込んだ分布がt分布で、サンプルが小さいほど裾が厚く(極端値が出やすく)なります。サンプルが増えると推定の揺れが小さくなり、t分布は正規分布に近づきます(=大標本ではZに近い直感が戻る)。

自由度(df)の意味:何が「1つ減る」のか

t分布の形を決めるパラメータが自由度(df)です。自由度は単なる「n-1」の暗記項目ではなく、標準偏差(ばらつき)を推定するために使える独立な情報量と捉えると理解が安定します。たとえば1標本の場合、平均を推定した時点で情報を1つ消費するため、分散推定に残る情報量がn-1になります。

自由度が小さいほど、分散推定の不確実性が大きくなり、t分布の裾が厚くなります。これは「少数サンプルでは、有意差判定が慎重になる(=同じt値でもp値が大きくなる)」ことを意味します。逆にdfが大きいほど、分布は正規分布に近づきます。

仮説検定としてのt検定:両側・片側の設計思想

t検定は、通常「帰無仮説(平均との差=0)」を置き、観測データが帰無仮説のもとでどれくらい起こりにくいか(p値)を評価します。ここで重要なのは、片側検定/両側検定は“結果”で選べないという点です。検定方向は研究仮説と設計(理論・先行研究・介入方向)で事前に定めるべきで、事後に有意に見せるために方向を選ぶのは研究品質を損ねます。

実務でも同様で、「改善したはずだから片側」と言い切れるには、悪化が実務上ほぼ起こり得ない/悪化を意思決定で許容しないといった前提が必要です。多くの現場・研究では両側が無難ですが、ここは“無難”ではなく“設計”として説明できる状態が理想です。

研究・業務での典型パターン

t検定は「平均を比較する」だけでなく、研究設計としては次の3パターンに分解できます。

  • 基準値との比較:基準(理論値・目標値・規格値)と比べたい(1標本)
  • 異なる集団の比較:独立した2群(例:施策A/B、介入群/対照群)を比べたい(独立サンプル)
  • 同一対象の前後比較:同じ人・同じ対象のBefore/Afterを比べたい(対応サンプル)

この分類が崩れると、データ構造に合わない検定を選びやすくなります。たとえば、同一人物の前後比較を独立サンプルでやると、「個体差」という大きなばらつきが誤差に混ざってしまい、検出力を自分で落とすことになります。

3種類の違いは「誤差の定義」が違うこと

t検定の種類は、メニュー上の違いではなく、平均との差をどの誤差(標準誤差)で割るかの違いです。言い換えると「ばらつきをどこに置くか(誤差構造)」が違います。ここを押さえると、以後の前提条件・出力解釈・効果量まで一貫します。

1標本t検定:比較対象が「理論値」になる

1標本t検定は、標本平均が基準値(理論値・目標値・規格値)からどれだけ離れているかを評価します。誤差は同一集団内のばらつきだけで決まり、群分けはありません。研究では「既知の基準」との比較が必要な場面(規格適合、目標到達、理論平均との差)で機能します。

独立サンプルt検定:群間差 vs 群内分散

独立サンプルt検定は、2つの独立した群の平均との差を評価します。ここでのポイントは、平均との差そのものよりも、群内のばらつき(分散)がどれくらいあるかです。群内分散が大きいほど、同じ平均差でも「偶然でも起きそう」と判断されやすくなります。

また独立サンプルt検定には「等分散を仮定する」形(いわゆるStudentのt)と、等分散を仮定しないWelchのt検定があります。実務上重要なのは、等分散が怪しい=即NGではなく、等分散が疑わしい場合にWelchを使うことで、推定の頑健性を確保できる点です。SPSSの独立サンプルt検定は出力上、等分散仮定の有無に対応する行を提示します(Base機能)。

対応サンプルt検定:差分を1変数として扱う

対応サンプルt検定は、Before/Afterのように「同一対象を2回測った」データに使います。理論的には、2条件の平均を別々に比べるのではなく、各対象の差分(After−Before)を1つの変数とみなし、その平均が0と異なるかを検定します。

この見方が重要なのは、個体差(人による基礎値の違い)が差分で相殺され、誤差が小さくなることが多いからです。結果として、同じサンプルサイズでも独立サンプルより検出力が高くなりやすいという性質が説明できます。「対応あり」を“便利なメニュー”ではなく、“誤差構造を組み替える設計”として理解すると、研究設計の質が上がります。

前提条件を「Yes/Noチェック」にしない

t検定で語られる前提(正規性・等分散・独立性)は、チェックリストとして“満たさないと不可”と扱われがちです。しかし実際には、前提は推定とp値の信頼性に影響する度合いが異なり、サンプルサイズや外れ値の状況によって実務的判断が変わります。

  • 独立性:設計上の前提。ここが崩れると検定以前の問題になりやすい。
  • 外れ値:平均と分散を強く動かすため、t検定の結論が変わり得る(最優先で点検)。
  • 正規性:小標本で影響が出やすい。大標本では中心極限定理で緩和される面もある。
  • 等分散:独立サンプルで重要。疑わしい場合はWelchを採用する設計が合理的。

SPSS出力で最初に見る順番

  • 要約統計(平均・SD・N):差の方向と大きさの当たりを付ける
  • 検定統計量(t, df, p):偶然の揺らぎで説明できるか
  • 平均差の信頼区間:差の推定幅(意思決定に直結)
  • (独立サンプル)等分散の扱い:該当行の選択を説明できる状態にする
SPSS独立サンプルt検定の出力例:Group Statistics(平均・標準偏差・サンプルサイズ)

図:(平均・標準偏差・N)。まず差の方向と規模感を把握し、後段のtとp値を“意味のある順番”で読むための土台にします。

SPSS独立サンプルt検定の出力例:Independent Samples Test(t値・自由度・有意確率・平均差の信頼区間)

図:独立サンプルの検定結果(t, df, p, 信頼区間)。等分散仮定の有無で行が分かれるため、どちらを採用するかを“説明できる”状態にするのがポイントです。

SPSS対応サンプルt検定の出力例:Paired Samples Test(差分の平均・t値・自由度・有意確率)

図:Paired Samples Test(対応サンプル)。差分を1変数として扱うため、解釈も「差分の平均が0と異なるか」に揃えると、理論と出力が一致します。

p値は“差の大きさ”を直接は語らない

t検定のp値は「帰無仮説のもとで、この程度以上の差が出る確率」です。つまり、p値はサンプルサイズやばらつきの影響を強く受け、差が小さくても大標本なら有意になり得ます。研究・実務の意思決定では、差の実質的意味を説明するために、効果量(例:Cohen’s d)を併記するのが有効です。

効果量は「平均との差を標準偏差で規格化した大きさ」で、文脈(領域・測定尺度・コスト)とセットで解釈するのが本筋です。“d=0.2/0.5/0.8”の暗記より、何が実務・理論上の意味ある差かを先に定義するほうがレビュー耐性が上がります。

APAスタイルの最小セット(例)

独立サンプルt検定の報告では、一般に 各群のM・SDt(df)p、可能なら効果量を示します。表の作り方(サンプル)についてはAPAの例も参照できます。

  • 独立サンプル(両側)例:「群A(M= , SD= )は群B(M= , SD= )よりも高く、差は有意であった, t(df)= , p= , d= であった。」
  • 対応サンプル(前後)例:「介入後は介入前よりも高く、差は有意であった, t(df)= , p= , d= であった。」
  • 片側検定の場合:片側である旨を明記し、研究仮説の方向性と整合させる。

※p値の表記(<.001 等)や統計記号の斜体など、表記ルールは媒体の投稿規定に合わせて調整します。

t検定の次:ANOVA・回帰への自然な接続

t検定は「平均差の検定」の入口であり、条件が3群以上になると分散分析(ANOVA)へ拡張されます。また、平均差を説明変数で表現する視点に移ると回帰分析へ接続します。t検定の“誤差構造”を理解していると、ANOVAや回帰の仮定(残差、等分散、推定の考え方)が連続的に理解できます。

t検定をSPSSで行うために必要な製品

t検定(1標本・独立サンプル・対応サンプル)は、IBM SPSS Statistics の基本機能(Statistics Base相当)で実行可能です。独立サンプルt検定の手順はBase機能で実行可能です。

  • まず必要:Statistics Base(t検定、基本統計、基礎的な比較)
  • 次の拡張:群が増える → ANOVA/一般線形モデル、説明変数が増える → 回帰・一般化線形モデルへ

正規性検定(Shapiro-Wilkなど)に通らないとt検定は使えませんか?

“通らない=即不可”ではありません。t検定が必要とするのは厳密な正規性というより、平均の推定とt統計量の近似が十分に機能する条件です。小標本・強い歪み・外れ値がある場合は結論が変わり得るため、外れ値の点検、分布の可視化、ノンパラ法との感度分析(結果の頑健性確認)をセットで判断すると研究品質が上がります。

等分散が怪しい場合はどうしますか?

独立サンプルt検定では、等分散を仮定しない Welch のt検定を採用するのが合理的です。SPSSの独立サンプルt検定は、等分散仮定の有無に対応する出力を提示します

片側検定と両側検定はどう選ぶべきですか?

研究仮説と設計で事前に定めます。結果を見てから有意にしたい方向へ選ぶのは不適切です。悪化の可能性を実務上も理論上も排除でき、意思決定として悪化を許容しない設計でのみ片側が説明しやすくなります。