主成分分析とは|SPSSでできること
主成分分析(Principal Component Analysis: PCA)は、多数の変数を情報量をできるだけ保ったまま、少数の合成変数(主成分)に要約するための統計手法です。
このページでは、主成分分析で分かることと、SPSSで実施する際に選ぶべき製品(オプション)を明確にします。
主成分分析とは
主成分分析は、変数間の分散・共分散構造に基づいて、新しい直交した合成変数(主成分)を作成する分析手法です。 各主成分は、元の変数の線形結合として定義され、データのばらつきを効率よく要約します。
この分析で分かること
- 多変量データの主要な変動パターン
- 変数間の冗長性(似た変数の存在)
- 少数次元によるデータの要約・可視化
- 後続分析に使う主成分得点
因子分析との違い
| 観点 | 主成分分析 | 因子分析 |
|---|---|---|
| 目的 | 情報の要約・次元削減 | 潜在構造の解釈 |
| 誤差の扱い | 考慮しない | 誤差項を分離 |
| 主な用途 | 前処理・可視化 | 尺度構成・理論検証 |
研究・ビジネスでの利用シーン
- 高次元データの次元削減
- 指標の整理・要約
- クラスタリング前の前処理
- 主成分スコアを用いた回帰分析
SPSSで主成分分析を行う場合の製品選定
主成分分析は、SPSS Statistics Base の標準機能で実施できます。 主成分の抽出、寄与率、固有値、主成分得点の算出は、すべて Base に含まれています。
| 目的 | 推奨製品 |
|---|---|
| 主成分分析(PCA) | IBM SPSS Statistics Base |
| PCA+回帰分析 | IBM SPSS Statistics + Regression |
| PCA後の構造検証 | IBM SPSS Amos |
分析時の注意点
- 変数の尺度をそろえる(標準化)
- 寄与率・累積寄与率を確認する
- 解釈よりも要約・前処理を目的とする
主成分分析の次に検討すべき分析手法
- クラスター分析:主成分得点による分類
- 回帰分析:主成分を説明変数として利用
- 因子分析:理論的構造の検討
