Text Coder X for SPSS(SPSS Statistics用テキストコード製品)ご利用ガイド

Text Coder X for SPSS はIBM SPSS Statistics上で稼働するテキストコーディング機能アドオン(アドオンとは、ソフトウェアに新たな機能を追加するプログラム)です。IBM SPSS Statisticsのメニューから操作が可能となり、テキストデータを指定しキーワードを抽出することができます。

主要機能

  • 統計解析ソフトウェアIBM SPSS Statistics用のテキスト分析用アドオンツール
  • SPSS Statisticsのメニューから操作が可能
  • 単語フィルタ機能:抽出したテキストから必要な品詞のみを選択することが可能
  • SPSSファイル生成機能:コード化したSPSSファイルを生成、100キーワードまで出力することが可能
  • 量的データに質的データを加えることが可能

稼働環境

  • 必須ソフトウェア:IBM SPSS Statistics v29 / v30
  • Windows OS:SPSS StatisticsがサポートしているWindows 10/11
  • MacOS:SPSS StatisticsがサポートしているMacOS Catalina10.5 / Big Sur11.0 / Monterey12.0 / Ventura13.0 / Sonoma14.0 / Sequoia15.0
  • Text Coder X for SPSSは、オープンソースの形態素解析「Sudachi」エンジンを利用して形態素解析を実行しています。

形態素解析器「Sudachi」について

Text Coder X for SPSSに利用している言語解析エンジンは、2017年にワークス徳島人工知能NLP研究所によりオープンソースとして開発されたjavaベースの「Sudachi」を利用しています。「Sudachi」は、最新の辞書を搭載し、UniDic、Neologdをベースとして専門家が開発した高品質なエンジンを利用しています。
「Sudachi」の特徴として標準搭載の辞書として表記正規化がカバーされているため、辞書を作成することなく多くの言葉を分割することが可能です。なお、ユーザー辞書を用意し拡張することも可能なエンジンです。
また、他のMeCabやKuromojiなどの形態素解析エンジンと比較して省メモリで稼働することも特徴の一つです。
詳細は、ワークス徳島NLP GitHubをご確認ください。

Text Coder X for SPSSの操作コンセプト

Text Coder X for SPSSは、SPSS Statistics上で文字列データを形態素解析し、必要な品詞にコード化したSPSSファイルを新たに作成する機能です。元データのID情報や属性情報の変数なども併せて出力可能です。

Text Coder X for SPSSのデータの準備

Text Coder X for SPSSでは、テキストデータを扱います。そのためSPSSファイル内にテキストデータ(文字列)をご用意ください。
編集ビュー上では「文字列」のデータが分析対象のデータとなります。(必須)
また、回答者ごとに集計を行うためにIDや回答者番号に該当するデータ(データ型は名義)を合わせて用意ください。(必須)
なお、回答者属性(性別やその他項目)と合わせてデータセットを作成可能なため必要な名義や順序データを用意しておくと良いでしょう。

Text Coder for SPSSメニューの起動

メインメニューから「分析」>「Text Coder for SPSS」をクリックします。

※メニューへの追加については、インストールガイドをご確認ください。

Text Coder X for SPSSの設定画面

  1. Text Coder X for SPSSの設定画面では、「回答者ID」、「テキスト」の2つの変数が最低限必要です。
  2. 回答者IDや回答者番号などの変数を「回答者ID」に設定します。
  3. 解析するテキスト文章を「テキストの変数を選択してください」に設定します。
  4. その他、併せて出力する変数については、「分析に利用する変数を選択してください」欄に設定します。
  5. 結果の表示方法については次項にて説明します。
  6. 設定が終了したら「OK」を押しましょう。

Text Coder X for SPSSの2つの表示設定

「単語が出現したかを0/1で表す」場合

1.各回答者別に該当する単語が出現したかを1/0で表示します。出現した場合が「1」、出現していない場合には「0」となります。

2.回答者が複数同じ言葉を記載しても表示は「1」となります。

「単語出現数をカウント」場合

1.各回答者別に該当する言葉が何回出現したかを表示します。

2.左の例でいえば、「ところ」については2回、「おいしい」が1回、「よい」が「1回」となります。


​テキスト解析が終了すると専用メニューが表示されます。はじめに①全体表示で抽出された語彙が表示されます。
②抽出条件にてお好きな品詞をクリックします。「品絞り込み」ボタンを押すと③抽出表示画面に抽出された情報が表示されます。
​最後にSPSSファイルに出力する④単語数を設定しましょう。最大100単語まで出力可能です。
​出力語が設定できたら「ファイルを出力する」をクリックすることでSPSSファイルが生成されます。

Text Coder X for SPSSで抽出可能な品詞

品詞名説明
名詞:一般一般的な名詞
名詞:サ変可能 ~動詞「する」に接続してサ行変格活用の動詞となりうる名詞
名詞:サ変形状詞可能「する」を付けることで動詞として機能したり,「な」や「の」を付けることで形容動詞として機能したりする言葉安心,おしゃれ,連続
固有名詞人名、地名、会社名、製品名など、特定の対象を指す名詞日本,田中,株式会社スマート・アナリティクス
代名詞名詞の代わりに,人や物を指し示す私,彼,彼女,こそあど言葉
動詞行動や状態を表現する品詞。その言い切りの形は、一般にウ段の音で終わるが、文語のラ行変格活用の語に限り、「り」とイ段の音で終わる走る,光る
形容詞おもに物事の性質や状態を表し、言い切りの形(終止形)が「〜い」となる言葉。大きい,低い
形状詞従来の品詞分類における形容動詞(「~な」「~の」を伴って名詞を修飾する)のグループの一部。活用しない点が形容動詞と異なる静か,綺麗,健康
接尾辞:形状詞的語尾につけて,その語を形状詞的にする言葉~三昧,~そう
接尾辞:形容詞的語尾につけて,その語を形容詞的にする言葉~的,~っぽい
接尾辞:動詞的語尾につけて,その語を動詞的にする言葉~化,~ナイズ
接尾辞:名詞的語尾につけて,その語を名詞的にする言葉~性,~感
接頭詞常に他の言葉に前につき意味を付加する各,御,お
副詞用言(動詞・形容詞・形容動詞)を修飾するとても,ゆっくり,はっきり
連体詞体言(名詞)に連なり名詞を修飾する働きをもつあらゆる,たいした

義語の作成方法

現バージョンでは類義語辞書を搭載していません。シンタックスにより出力後に単語をまとめる作業を行います。

出力後の分析方法の例