SPSSによる多重回答データの集計方法|SPSSの小技:第4回

SPSSの小技:多重回答データの集計方法

SPSSでアンケートデータを分析する際、多くの方が一度は悩むのが多重回答(複数回答)データの集計方法です。本記事では、「あてはまるものをすべて選択してください」形式で取得したデータを、SPSSで正しく・再現性高く集計する方法を小技として解説します。
特に重要なポイントとして、分析前のデータ構造(変数設計)にも触れます。

よくあるつまずきポイント

多重回答データでは、次のような悩みが頻出します。

  • 度数分布表を作ると、項目ごとに集計されて意味が分かりづらい。
  • 回答者数と合計が合わず、解釈に困る
  • Excelのピボットでは集計できていたのに、SPSSで同じことができない
  • Googleフォームのデータをそのまま読み込んだら分析できなかった

これらの多くは、データの持ち方(変数構造)が不適切であることが原因です。

多重回答を扱う前提条件:変数は「項目ごと」に分ける

多重回答データをSPSSで正しく集計するためには、選択肢ごとに変数が分かれていることが必須条件になります。

推奨されるデータ構造(正)

IDQ1_選択肢AQ1_選択肢BQ1_選択肢C
1101
2010
  • 選択した項目:1
  • 選択していない項目:0
  • 尺度の設定:名義

この形式であれば、SPSSの多重回答セットを問題なく定義できます。

Googleフォームのデータはそのままでは使えない

多くの場合、次のような形式で出力されます。

  • 1つのセルに
    選択肢A, 選択肢C
    のように文字列で格納されている
  • 1変数=1質問の形になっている

この形式のままでは、SPSSの多重回答分析は実行できません

必要な前処理

  • 選択肢ごとに変数を分割する
  • 「選択=1/未選択=0」の二値変数に変換する

この前処理を行ってはじめて、SPSSの多重回答機能が使えるようになります。

多重回答データとは

多重回答データとは、1人の回答者が複数の選択肢を同時に選べるデータ形式を指します。
SPSSでは、以下のような「変数が分かれている構造」を前提として処理されます。

多重回答セットを定義する

SPSSでは、多重回答データを正しく扱うために
多重回答の変数グループを定義します。

これにより、

「複数の変数を、1つの質問として集計する」

ことが可能になります。

SPSSでの操作手順:準備編

Step 1:多重回答セット定義画面を開く

メニューから [分析]→[多重回答]→[変数グループの定義] を選択します。

多重回答セットを定義するための設定画面

Step 2:多重回答を定義する

多重回答セットを定義するための設定画面

設定画面では、多重回答に該当する項目を選択し、「変数グループの変数」に設定します。
「変数のコード化様式」は、今回は「1」に設定します。これはデータ上、該当する項目を2にしている場合には「2」のようにデータに合わせて設定します。

「名前」の部分は任意の変数名を設定しましょう。
出来たら真ん中の「追加」ボタンを押し、「多重回答グループ」に追加されたら「閉じる」を押してください。

SPSSでの操作手順:分析編

Step 3:多重回答の集計表を作成してみましょう。

メニューから [分析]→[多重回答]→[度数分布表] を選択

多重回答から度数分布表を選択

Step 4:設定画面で先ほど作成した多重回答の変数を選択します。

「多重回答グループ」から該当する変数を選択し、右ボタンで「テーブル」に移動。

多重回答から度数分布表を選択

出力結果の見方

多重回答の結果には、2種類の割合が表示されます。

  • 回答%:選択肢が選ばれた割合
  • ケース%:回答者のうち、その選択肢を選んだ人の割合

研究・報告書では、通常 ケース% を用います。

出力画面

よくあるミス・注意点

変数分割を行わずに分析を始めてしまう

Googleフォームの文字列データを直接使う

ケース%と回答%を混同する

 

よくある質問

Googleフォームの多重回答は必ず加工が必要ですか?

はい。SPSSで多重回答分析を行う場合、必ず変数分割が必要です。

0/1以外の値でも使えますか?

可能ですが、0/1が最も安全で再利用性が高い方法です。