
統計解析のスタンダードツールとして、全世界、国内でも非常に多くのユーザーが利用する「IBM SPSS Statistics」の最新バージョン「IBM SPSS Statistics 31」がリリースされました。
最新バージョン「IBM SPSS Statistics 31」では空間分析の近接マップ、変数間の複雑な関係性を考慮した距離相関、時系列データのノイズを除去する時系列フィルタリング、決定木の一種である条件付き推論ツリー、出力テーブルの読み解きをサポートするキュレーションヘルプ、他にもユーザーの操作性を考慮した機能が追加されています。また、Excelデータの読込みの改善も行われています。
‐IBM SPSS Statisticsシステム要件詳細「IBMSoftwareProductCompatibilityReports」
‐ IBM SPSS Statisticsコミュニティサイト
【新機能1】
近接マッピング(Proximity Mapping)
近接解析は、地理的な距離を中心に据える空間分析ツールであり、GISやクラスタリングアルゴリズム、レコメンデーションシステムで広く利用されています。空間的または特徴に基づく近接性を理解するのに役立ち、財務やマーケティングリサーチにも有益です。

【新機能2】
距離相関(Distance Correlation)
距離相関は、2つのランダム変数やデータセット間の統計的な依存関係を測定する手法で、線形関係だけでなく非線形な関係も捉えることができます。2つの数値変数の間に関係があるかどうかを調べるための、堅牢で汎用性の高い方法です。ピアソンの相関が線形の依存関係に限られるのに対し、距離相関はより複雑な関係性も把握できるため、高次元データの解析において特に有効です。

【新機能3】
時系列フィルタリング
時系列フィルタリングは、一定間隔で収集されたデータを対象とする時系列分析において、重要な手法のひとつです。この手法の主な目的は、データに含まれるノイズを取り除き、有用な情報を抽出することで、トレンドやパターンの把握、さらには予測の精度を高めることにあります。

【新機能4】
条件付き推論ツリー
条件付き推論ツリー(CIT)は、相関に基づく再帰的な分割を行う決定木の一種であり、他のすべての要因の影響を同時に考慮することで、予測変数の本来の効果をより正確に捉えることができます。従来の決定木とは異なり、CITではデータの分割にp値を用いるため、分類や回帰のタスクにおけるバイアスを抑えるのに有効です。この点が、従来の決定木手法に対する拡張と言えます。

【新機能5】
STATS Earth
Pythonの新しい拡張機能であり、オープンソースパッケージ「Earth」に基づいています。このパッケージは、多変量適応回帰スプライン(MARS:Multivariate Adaptive Regression Splines)アルゴリズムを基盤としており、柔軟な回帰モデルの構築に活用されます。

【新機能6】
キュレーションヘルプ
特定の統計手法をデータセットに適用した後、この機能を使うことで、出力されたテーブル内の特定の数値に関する詳細な情報を確認することができます。この機能は、相関分析に対応しており、結果の解釈をより深めるのに役立ちます。

新機能の詳しい解説と実行方法
新機能1 近接マッピング
近接マッピングは、多変量データの次元を減らし、オブジェクト(ケース、アイテム、または他のエンティティ)間の関係を空間構成で表示するために使用される可視化技術です。 複数の近接ソースをサポートし、追加の変数(属性とプロパティ)を組み込み、幅広い変換と制限のオプションを提供します。 これらの機能により、PROXMAPは多変量構造を探索し、多様なタイプのデータを統一された空間表現に統合するための強力なツールとなっています。
分析> マッピング>近接マッピングから実行できます。
新機能2 距離相関
距離相関は、2つのランダム変数やデータセット間の統計的な依存関係を測定する手法で、線形関係だけでなく非線形な関係も捉えることができます。2つの数値変数の間に関係があるかどうかを調べるための、堅牢で汎用性の高い方法です。ピアソンの相関が線形の依存関係に限られるのに対し、距離相関はより複雑な関係性も把握できるため、高次元データの解析において特に有効です。
分析 > 相関 > 距離相関から実行できます。
新機能3 時系列フィルタリング
データに含まれるノイズを取り除き、有用な情報を抽出することで、トレンドやパターンの把握、さらには予測の精度を高めることにあります。経済分析などの分野で活用されており、Pythonの拡張機能をベースとしたアルゴリズムが用いられ、オープンソースパッケージである「statsmodels」がその実装に利用されています。
Pythonプラグインの拡張プロシージャとして、 拡張機能ハブ (拡張機能 > 拡張機能ハブ )から拡張機能 Time Series Filters (TSF)を検索してインストールします。拡張機能をインストールした後、分析 > 予測 > 時系列フィルター (TSF)から実行できます。
新機能4 条件付き推論ツリー
条件付き推論ツリー手順は、条件付き推論や並べ替え検定のための統一されたフレームワークを用いて、分類木や回帰木を推定します。 オーバーフィットの可能性を減らし、より安定したツリーを提供します。 この手順で提供されるツリーには、条件付き推論ツリーとモデルベース・ツリーの2種類があります。
Rプラグインによる拡張手続きとして、 拡張機能ハブ(拡張機能 > 拡張機能ハブ )から拡張機能 Conditional Inference Treeを検索してインストールします。 拡張機能をインストールした後、分析 > 分類 > CIツリーから実行できます。
新機能5 STATS Earth
Rプラグインで拡張手続きとして、拡張機能ハブ (拡張機能 > 拡張ハブ ) から拡張機能 Multiple Adaptive Regression Splines を検索してインストールします。拡張機能をインストールした後、 分析 > 一般化線形モデル > 多重適応回帰スプラインから実行できます。
新機能6 キュレーションヘルプ
IBM SPSS Statistics 31 では、以下のメニューでキュレーションヘルプを利用できます。
- 2変量 (分析 > 相関 > 2変量)
- 偏相関 (分析 > 相関 > 偏相関)
- 距離 (分析 > 相関 > 距離)
- 正準相関 (分析 > 相関 > 正準相関)
- 線形回帰での相関 (分析 > 回帰 > 線型
□記述統計、□部分/偏相関 )
キュレーションヘルプの出力が不要な場合は、編集>オプション [出力]で指定できます。
そのほかのSPSS Statistics 31 新機能
グレーアウト機能
ライセンス登録されていないアルゴリズムや機能は、メニュー上で濃いグレーの鍵マーク付きで表示されます。
未購入のアルゴリズムや機能を選択しようとすると、購入手続きの案内が表示され、スムーズにライセンス登録へ進むことができます。

ユーザーエクスペリエンスの強化
•Excelファイルを読み込む際には、どの行をヘッダーとして使用するかを自由に選べるようになり、データの取り込みがより柔軟になりました。
•ダークモードがさらに見やすくなり、長時間の作業でも目にやさしい快適な環境が実現されました。
•複数の変数を1つに統合したり、変数の型を変更したり、複数変数を同時に扱う際の課題に対応し、データ変換や整形の操作性が改善されました。
•実験計画法(DoE)の手法にすばやくアクセスできる検索バーが追加され、目的の分析方法をすぐに見つけられます。
•ピボットテーブル、グラフ、テキスト出力などのスタイル設定をひとつの「出力テーマ」として保存・再利用できるようになりました。
•変数ビューで設定した列幅がセッションをまたいで保持されるようになり、毎回調整する手間がなくなりました。
•CDB画面のタブ付きコントロールでは、キーボードショートカット(ニーモニックキー)に対応し、よりスムーズな操作が可能になりました。
•IBMのブランドガイドラインに基づき、起動画面(スプラッシュスクリーン)が新しくなりました。
•データにフィルターが設定されている場合、現在選択されているケース数がステータスバーに表示されるようになりました。
•チャートに背景画像を追加できるようになり、さらに .png、.jpg、.svg、.bmp、.tif など多様な形式でエクスポートが可能になりました。
セキュリティの強化
•JRE/JDKがバージョン17.0.13.0にアップグレードされ、より高い互換性とセキュリティが確保されました。
•旧来の画像処理用ライブラリである jai_*.jar ファイルは、よりモダンで柔軟性の高い commons-imaging ライブラリに置き換えられました。