クラスター分析とは|SPSSでできること

クラスター分析は、データ同士の類似性にもとづいて、 対象を自動的にグループ化するための分析手法です。
このページでは、クラスター分析で分かることと、SPSSで実施する際に選ぶべき製品(オプション)を明確にします。

クラスター分析とは

クラスター分析は、事前にグループ数を定めず、 データ間の距離や類似度にもとづいて対象を分類する探索的多変量解析です。 マーケティングのセグメンテーション、行動パターン分析、アンケート分析などで広く用いられます。

この分析で分かること

  • 似た特徴を持つ対象のグループ化
  • データ構造の把握(自然な分かれ方)
  • セグメントごとの特徴の違い

クラスター分析の主な手法

  • 階層クラスター分析:データ構造を樹形図で把握
  • k-means クラスター分析:指定したクラスター数で分類
  • Two-Step クラスター分析:大規模データ・混合尺度に対応

SPSSでクラスター分析を行う場合の製品選定

階層クラスター分析、k-means クラスター分析、Two-Step クラスター分析は、 IBM SPSS Statistics Base の標準機能で実施できます。 追加オプションは不要です。

分析手法対応製品特徴
階層クラスター分析 IBM SPSS Statistics Base 構造把握
k-means クラスター分析高速・指定クラスタ数
Two-Step クラスター分析混合尺度・大規模データ

分析時の注意点

  • 変数のスケーリング(標準化)を検討する
  • クラスタ数の妥当性を必ず確認する
  • 結果は探索的であり、検定ではない

クラスター分析の次に検討すべき分析手法

  • 判別分析:分類ルールの構築
  • コレスポンデンス分析:カテゴリ構造の可視化
  • 回帰分析:クラスター別要因分析