SPSSの使い方 ~IBM SPSS Statistics超入門:第10回(最終回):グループの平均の差を比較する

SPSSの使い方

当コラムで利用している製品

SPSS Statistics

全世界で28万人以上が利用する統計解析のスタンダードソフトウェアです。
データ分析の初心者からプロまでデータの読み込みからデータ加工、分析、出力までをカバー。

SPSS製品に関するお問い合わせ/お見積りはこちら

【関連情報】

SPSSの使い方 ~IBM SPSS Statistics超入門~
第10回(最終回):グループの平均の差を比較する

SPSSの使い方〜IBM SPSS Statistics超入門〜もいよいよ最終回となりました。
データの読み込みから始まり、基本的な操作を紹介してきましたが、使えるようになりましたでしょうか?

最終回では、SPSSによるグループ間の差の検定について解説を進めていきましょう。2つの量的変数の関係性を把握するための平均値の差の検定を中心に紹介をしていきます。

さて、グループ間の差を確かめる方法はいくつかあります。比較対象のグループ数と、対応の「ある」「なし」によって分析手法が異なります。

「対応のある」とは、同じ対象者のテストの前後の比較や投薬の前後での比較などの場合をいいます。

一方、「対応のない」とはAとBのグループの値を比較するなどの場合をいいます。

検定の種類

さて、その中でも今回は、対応のない2つのグループの差の検定について実施していきます。

対応のない2つのグループの平均値の差の検定

平均値の差の検定は、手元のデータ(標本)において2つのグループの平均値に差があった場合、母集団でも同様の差が見られるのか、統計的にその差が意味のあるものであるのかを確かめる手法です。たとえば、2つのグループの学生に行ったテストの平均点が異なっていた場合、その差が母集団(全体)でも同様になりたつのか?その2つのグループ間の点数の差には意味があるのか、または偶然なのかを確認するときに利用します。

そのために必要なデータ項目は、グループ(名義)がわかる変数と、平均値を求めるための量的変数です。

なお、2変数より大きい、つまり3つ以上グループを比較するときは、一元配置分散分析などの手法で行います。

さて、それでは2つのグループに差があるかどうかを確かめていきましょう。利用するデータは、これまでと同じサンプルデータ[demo.sav]です。今回は、キャンペーンに反応したグループと反応していない2つのグループによって世帯年収に違いがあるのかを確認していきます。

SPSSで実行する平均の比較

それでは早速、SPSSで平均の比較を実行していきましょう。

Step1:メニューから[分析]>[平均の比較]>[グループの平均]を選びます。

図10_1

Step2: [グループの平均]ダイアログが表示されます。

ここでは、[従属変数]の部分に量的変数である[世帯全体の収入(千ドル)]を入れます。さらに[独立変数]部分には、グループを表す変数である[反応]を入れて、「OK」を押します。

ポイントとしては、従属変数部分に量的データ、独立変数にはグループのわかる名義尺度を設定します。なお、今回はt検定ではなくまだグループ間の比較を行うため、独立変数部分は2つ以上のグループがあっても結構です。

図10_2

 

 

 

 

 

 

 

Step3: 出力結果を確認しよう

図10_3 図10_4

上記のような出力が出てきます。反応ありとなしで平均値が11ポイントほど違いそうです。平均値を確認すると2つのグループに差があるように見受けられます。しかし、統計的に差があるのかを確認する必要があります。そこで今度は、t検定を利用して平均値の差を確かめます。

2つのグループの平均値の検定:t検定

ここからはSPSSによる平均値の差の検定(t検定)を実行してみましょう。

Step1: メニューバーから[分析]>[平均の比較]>[独立したサンプルのt検定]を選びます。

図10_5

 

 

 

 

 

 

前半部分で紹介したように2つのグループの平均値を比較する際には「独立したサンプルのt検定」を選択します。

Step2: t検定のダイアログの設定

[独立したサンプルのt検定]ダイアログボックスが表示されます。左側の変数候補リストから確認したい変数である[世帯全体の収入]を選択し、  で[検定変数]に入れます。[グループ化変数]部分には、2つのカテゴリ値をもつ変数を入れます。ここでは[反応]を入れましょう。

図10_6

 

 

 

 

 

 

図10_7図10_8

 

 

 

 

 

「反応(??)となっていますので、「グループの定義」を押して、グループの定義をします。
この例では、あり=0、なし=1です。そして、「続行」 を押します。[独立したサンプルのt検定]の画面に戻ると、[グループ化変数]部分が反応(0,1)となっているはずです。これでOKです。

Step3: t検定の出力を確認しよう

分析結果が出力されました。

図10_9 図10_10

はじめに[グループ統計量]の部分で、各変数の度数や平均値、標準偏差、標準誤差について確認を行います。今回は、ダイレクトメールに反応「あり」「なし」の2つのグループにおいて、世帯年収に違いがあるのかを分析しているので、この結果から、反応ありの世帯収入平均値が約59.7、反応なしの世帯収入平均値が約70.6ということがわかりました。この平均値の差は、果たして母集団においても2つのグループにおいて差があると言い切れるのでしょうか。

SPSSにおけるt検定の出力結果の読み方

そこで、2つのグループの平均の差があるかを確認するt検定を行います。t検定を行う際には、前提条件として以下の3つを満たしていることが求められます。

  • 標本は無作為に抽出されていること
  • 母集団の分散は正規分布もしくはそれに近いものであること
  • 2つのグループの母集団の分散が等しいこと

この3つ目の等分散性を確認するために、「等分散性のためのLevene(ルビーン)の検定」を行います。

 SPSSの出力で言えば、[独立サンプルの検定]の部分に該当します。SPSSにおけるt検定においては、2つの検定を行っています。まずは、等分散性のためのLeveneの検定において等分散性を確認したうえで、2つの母平均の差の検定を行います。

 はじめに[等分散性のためのLeveneの検定]を見てみましょう。この検定においては前述とおり2つのグループの母集団の分散が等分なのかを検定します。この際の帰無仮説は「2つのグループの分散は等しい」、当然対立仮説は「2つのグループの分散は等しくない」となります。t検定では、「2つのグループの母集団の分散が等しいこと」が前提条件となりますので、帰無仮説を採用する必要があります。

 通常、検定というと帰無仮説を棄却したい場合が多いのですが、ここは採用をする必要があります。

 そのため、この部分の[有意確率]が5%(0.05)を超える場合には、そのまま右側の[2つの母平均の差の検定]に進み、[有意確率(両側)]部分を確認します。

 [等分散性のためのLeveneの検定]の有意確率部分が5%に満たない場合には、[等分散を仮定しない]行に進み、右側の[2つの母平均の差の検定]を確認します。

 今回の結果の場合、[有意確率]が0.106、つまり10.6%です。このため、等分散を仮定していると解釈することができるため[等分散を仮定する]行を確認します。

 右側に移動し、[2つの母平均の差の検定]の[有意確率(両側)]を確認し、0.001となっていますのでその差は母集団においても同様の差があるといえる。統計的に有意であると解釈できます。したがって、ダイレクトメールの反応「あり」「なし」の2つのグループにおいて世帯収入に差があるということがわかります。

平均値の差の検定では、Levene検定の部分の解釈が若干ややこしいとも言えますので、注意をして分析を進めてください。

最後に

さて、10回にわたりSPSSの基本的な操作方法について解説してきました。このコラムを参考にしていただき、SPSSの世界を始めていただければ幸いです。今回は、初歩的な部分について解説しましたが、SPSSが搭載している手法はまだまだ数多くあります。また理論面についても奥が深いものです。

入門編はこれにて終了となりますが、今後、今回以外の内容についても解説をしていきますので、楽しみにしていてください。

なお、以下にありますように「はじめてのSPSS超入門」コースでは、初歩的な操作方法から理論面まで1日で習得できるプログラムを組んでいます。ぜひこちらのコースの受講も検討ください。

【トレーニング情報】「はじめてのSPSS超入門」

はじめてのSPSS超入門

統計解析ソフトウェア「IBM SPSS Statistics」をはじめて導入して使い始める方向けのトレーニングコースです。SPSSの起動やデータの読み込み、基本操作などの基本を学ぶことから始まり、データ分析に必要なデータ準備やデータ加工、そして基本集計でもある記述統計を実際にPCを操作しながら習得することが可能です。さらには、2変量同士の解析として基本の相関分析、クロス集計(カイ2乗検定)、平均値の差の検定(t検定)までを1日で学ぶことが可能です。

   トレーニングの日程・詳細はこちら