ロジスティック回帰分析とは?
― 二値・カテゴリ結果の発生確率を予測・要因分析
目的変数が「はい/いいえ」「発生/非発生」などのカテゴリ型である場合に、要因の影響や発生確率を推定する回帰分析手法。オッズ比により各要因の影響を定量化し、医療・マーケティング・調査など幅広い領域で活用されます。
ロジスティック回帰分析とは
ロジスティック回帰分析は、目的変数がカテゴリ型(主に二値:はい/いいえ、発生/非発生など)である場合に、要因の影響や発生確率を推定するための回帰分析手法です。通常の回帰分析が連続変数を予測するのに対し、ロジスティック回帰はロジット関数を介した確率モデルで「事象が起こる確率」を予測します。
ロジスティック回帰分析で分かること
- 事象が発生する確率(予測確率)
- 各要因(説明変数)が発生確率に与える影響の方向と大きさ
- オッズ比による「○倍リスクが高い/低い」の定量化
- 複数要因を同時に考慮した、調整済みの効果
ロジスティック回帰分析の主な種類
| 種類 | 目的変数 | 例 |
|---|---|---|
| 二項ロジスティック回帰 | 2カテゴリ | 発症の有無、購入/非購入 |
| 多項ロジスティック回帰 | 3カテゴリ以上・順序なし | 製品A/B/Cのどれを選ぶか |
| 順序ロジスティック回帰 | 3カテゴリ以上・順序あり | 満足度(高/中/低)、重症度(軽症/中等度/重症) |
SPSSでロジスティック回帰分析を行うやり方(操作手順)
SPSS Statistics に SPSS Regression オプションを追加すると、メニュー操作だけでロジスティック回帰分析を実行できます。ここでは最もよく使われる二項ロジスティック回帰のやり方を、手順に沿って解説します。
- ステップ1:データを準備する
目的変数(「発症あり/なし」など2値のカテゴリ変数)と説明変数を1つのデータセットにそろえ、変数ビューで各変数の尺度を正しく設定します。 - ステップ2:メニューを開く
メニューから [分析]→[回帰]→[二項ロジスティック] を選択します。多カテゴリなら[多項ロジスティック]、順序のある目的変数なら[順序]を選びます。 - ステップ3:変数を指定する
2値の目的変数を「従属変数」に、説明変数を「共変量」に投入します。 - ステップ4:カテゴリ変数を指定する
「カテゴリ」ボタンから、性別や治療群などの名義尺度の説明変数をカテゴリ共変量として登録し、参照カテゴリを設定します。 - ステップ5:変数選択の方法を選ぶ
「方法」で、すべての説明変数を一度に投入する「強制投入法」か、統計的基準で取捨選択する「ステップワイズ法」を選びます。仮説が明確なら強制投入法が基本です。 - ステップ6:オプションを設定する
「オプション」からHosmer-Lemeshowの適合度検定、Exp(B)の95%信頼区間などにチェックを入れます。必要に応じて「保存」で予測確率を保存します。 - ステップ7:実行して結果を読み取る
[OK]で実行し、モデルの適合度(Hosmer-Lemeshow検定)、分類テーブル(予測精度)、「方程式中の変数」表の係数B・有意確率・Exp(B)=オッズ比を確認します。
研究・ビジネスでの利用シーン
発症リスク要因の特定
医療研究
疾患の発症有無を目的変数に、年齢・生活習慣・既往歴などを調整した分析で、オッズ比により独立したリスク要因を抽出します。
解約・離反の予測モデル
マーケティング
過去の利用ログを説明変数として解約確率を予測。スコアリングして優先順にリテンション施策を打つ運用が可能です。
選択行動のモデル化
調査・選好分析
多項ロジスティック回帰で複数選択肢の選好をモデル化し、属性が選択に与える影響を分析します。
SPSSで実施する場合の製品選定
分析する目的変数のカテゴリ数によって、必要となるSPSSのオプションモジュールが異なります。設計段階で「2値か多カテゴリか」を整理し、必要な製品をご確認ください。
| 分析内容 | 対応製品 | 備考 |
|---|---|---|
| 二項ロジスティック回帰 | IBM SPSS Statistics Base + SPSS Regression | BaseにRegressionの追加が必要 |
| 多項ロジスティック回帰 | IBM SPSS Statistics Base + SPSS Regression | 3カテゴリ以上の選択行動などに対応 |
| 順序ロジスティック回帰 | IBM SPSS Statistics Base + SPSS Regression | 順序尺度の目的変数を扱う場合 |
| 反復測定/階層構造データ | IBM SPSS Statistics Base + Advanced Statistics | GEE・線形混合モデルで拡張 |
分析時の注意点
- サンプルサイズはEPV(最も少ない結果カテゴリのケース数÷説明変数の数)が10〜20以上になるよう設計する
- 説明変数間の強い相関(多重共線性)に注意する
- モデルの当てはまりはHosmer-Lemeshow検定、判別力はROC曲線・AUCで評価する
- オッズ比はリスク比とは異なる指標である点に注意して解釈する
ロジスティック回帰とROC分析、専門家がサポートします
分析設計から結果解釈・論文記述まで——研究テーマに応じてご相談いただけます。
「分析アドバイザリーサービス:ロジスティック回帰とROC分析」もご利用いただけます。
お電話でのご相談:0120-835-761 受付 9:00–18:00(土日祝除く)
よくあるご質問
お気軽にご相談ください0120-835-761受付時間 9:00-18:00 [ 土・日・祝日除く ]
問合せ・見積・注文をする お気軽にお問い合わせください