欠損値分析とは|SPSSでできること

欠損値分析は、データに含まれる欠測値が分析結果に与える影響を評価し、適切な方法で補完・処理するための分析手法です。
このページでは、欠損値分析で分かることと、SPSSで実施する際に選ぶべき製品(オプション)を明確にします。

欠損値分析とは

欠損値分析は、データに欠測が存在する場合に、その発生パターンや影響を把握し、 分析の精度低下やバイアスを防ぐための手法です。 単純な除外処理だけでなく、統計モデルに基づく補完(代入)を行うことで、情報損失を最小限に抑えます。

この分析で分かること

  • 欠損の発生割合・分布
  • 欠損がランダムかどうか(MCAR / MAR / MNAR の考え方)
  • 欠損が分析結果に与える影響
  • 補完(代入)後データの妥当性

欠損値分析の代表的な方法

  • リストワイズ削除:欠損を含むケースを除外
  • 平均値・中央値代入:簡易的な補完
  • 回帰による補完:他変数から予測
  • EMアルゴリズム:最尤推定に基づく補完

SPSSで欠損値分析を行う場合の製品選定

欠損値の確認や単純な処理は、 IBM SPSS Statistics Base で実施できます。 より高度な欠損値補完を行う場合は、専用オプションを利用します。

より高度な欠損値のパターン発見、多重代入を行う際にはIBM SPSS Missing Valuesがおすすめです。

分析時の注意点

  • 欠損の発生メカニズムを仮定せずに補完しない
  • 補完後データでの過信に注意する
  • 研究報告では欠損処理方法を明記する

欠損値分析の次に検討すべき分析手法

  • 回帰分析:補完後データによる要因分析
  • 因子分析・SEM:欠損を考慮した構造分析
  • 多重代入法:より厳密な推定