Two-Step クラスター分析とは?
― 大規模データ・混合尺度に対応した2段階クラスタリング
大量のケースをクラスタ化するための2段階アルゴリズム。最初のステップでクラスタ中心を発見し、2番目のステップで階層クラスタ化を行い結合します。最適クラスタ数の自動推定と混合尺度対応が最大の特長です。
Two-Step クラスター分析とは
大量のケースをクラスタ化するための2段階アルゴリズム。最初のステップでクラスタ中心を発見し、2番目のステップで階層クラスタ化を行い結合します。最適クラスタ数の自動推定と混合尺度対応が最大の特長です。
Two-Step クラスター分析で分かること
- 大量データの自動セグメント分け
- 混合尺度データでのグループ構造
- 最適なクラスタ数の推奨値
- 各クラスタのプロファイル
Two-Step クラスター分析の主な種類
| 特徴 | Two-Step | k-means | 階層 |
|---|---|---|---|
| クラスタ数指定 | 自動推定可 | 事前指定必須 | 事後決定 |
| データ規模 | 大規模可 | 大規模可 | 中規模まで |
| 変数の型 | 混合尺度可 | 連続のみ | 連続中心 |
研究・ビジネスでの利用シーン
全顧客セグメント化
大規模顧客DB
数十万件規模の顧客データを最適クラスタ数で自動分類し、マーケティング戦略に活用します。
属性+行動の統合分析
混合データ
デモグラ(カテゴリ)と購買金額(連続)を同時に扱うセグメンテーションを実施します。
アクセスパターン抽出
Web解析
大量のアクセスログを高速にセグメント化し、サイト改善材料とします。
SPSSで実施する場合の製品選定
Two-Step クラスター分析をSPSSで実施する際に必要となる製品とオプションを整理します。
| やりたいこと | 対応製品 | 備考 |
|---|---|---|
| Two-Step クラスター分析 | IBM SPSS Statistics Base | 標準機能 |
| 大規模/高度なクラスタリング | IBM SPSS Modeler | データマイニング基盤 |
分析時の注意点
- 外れ値検出機能を活用する
- 最適クラスタ数の自動推定値は参考。解釈性も加味する
- 変数の選択がクラスタ結果を大きく左右する
- 再現性確保のため乱数シードを固定
Two-Step クラスター分析の進め方、専門家がサポートします
分析設計の段階から、結果解釈・論文記述まで——研究テーマに応じてご相談いただけます。
必要なSPSS製品の構成もあわせてご提案します。
お電話でのご相談:0120-835-761 受付 9:00–18:00(土日祝除く)
よくあるご質問
お気軽にご相談ください0120-835-761受付時間 9:00-18:00 [ 土・日・祝日除く ]
問合せ・見積・注文をする お気軽にお問い合わせください