主成分分析とは|SPSSでできること

主成分分析(Principal Component Analysis: PCA)は、多数の変数を情報量をできるだけ保ったまま、少数の合成変数(主成分)に要約するための統計手法です。
このページでは、主成分分析で分かることと、SPSSで実施する際に選ぶべき製品(オプション)を明確にします。

主成分分析とは

主成分分析は、変数間の分散・共分散構造に基づいて、新しい直交した合成変数(主成分)を作成する分析手法です。 各主成分は、元の変数の線形結合として定義され、データのばらつきを効率よく要約します。

この分析で分かること

  • 多変量データの主要な変動パターン
  • 変数間の冗長性(似た変数の存在)
  • 少数次元によるデータの要約・可視化
  • 後続分析に使う主成分得点

因子分析との違い

観点主成分分析因子分析
目的情報の要約・次元削減潜在構造の解釈
誤差の扱い考慮しない誤差項を分離
主な用途前処理・可視化尺度構成・理論検証

研究・ビジネスでの利用シーン

  • 高次元データの次元削減
  • 指標の整理・要約
  • クラスタリング前の前処理
  • 主成分スコアを用いた回帰分析

SPSSで主成分分析を行う場合の製品選定

主成分分析は、SPSS Statistics Base の標準機能で実施できます。 主成分の抽出、寄与率、固有値、主成分得点の算出は、すべて Base に含まれています。

目的推奨製品
主成分分析(PCA)IBM SPSS Statistics Base
PCA+回帰分析IBM SPSS Statistics + Regression
PCA後の構造検証IBM SPSS Amos

分析時の注意点

  • 変数の尺度をそろえる(標準化)
  • 寄与率・累積寄与率を確認する
  • 解釈よりも要約・前処理を目的とする

主成分分析の次に検討すべき分析手法

  • クラスター分析:主成分得点による分類
  • 回帰分析:主成分を説明変数として利用
  • 因子分析:理論的構造の検討