~ビジネスマンのためのデータ分析入門~ 第2回:そもそもデータとは何か?
【参加無料】さわって体験「IBM SPSS Statistics」ハンズオンセミナー
第2回:そもそもデータとは何か?
さて、すこしずつ本題にはいっていきましょう。前回述べたように、近年、ビッグデータ、IoT、人工知能などさまざまなデータを活用することに関するキーワードがメディアを賑わしています。皆さんは、まさに「データ分析の時代」に生きているといっても過言ではありません。
ただ、データ活用にこれから取り組もうとお考えの方からすると、何から手を付ければよいのか、何をすればよいのか?を判断するのが難しい時代になってきたということもいえるでしょう。
何をすればよいのか?この部分を解説していきますが、ヒントとしてまずは「データを活用すること」とはどういうことなのか?について考えていきましょう。
データとは何か?
そもそもデータとは何でしょうか?データとは、数字や文字の羅列などに意味(情報)を持たせたものといえます。つまり、次のようなものがデータです。
データ = 数値 or 文字 + 情報(意味)
例えば、顧客の購買データを考えてみると、みなさんが以下のようなデータをもっていたとしましょう。
行数 | 会員ID | 購入金額 |
1 | 0001 | 1000 |
2 | 0003 | 2000 |
3 | 0004 | 2400 |
4 | 0005 | 2200 |
5 | 0001 | 1500 |
・・・ | ・・・ | ・・・ |
各セルの中身だけを見ればこれはただの数字の羅列にしかすぎません。しかし、表頭の情報を元に参照すれば、2列目は会員IDを示しており、また3列目は購入金額を示していることが判明します。これがデータです。これが文字列でも同じです。
行数 | 会員名 | 購入金額 |
1 | 佐藤 | 1000 |
2 | 鈴木 | 2000 |
3 | 山田 | 2400 |
4 | 斉藤 | 2200 |
5 | 佐藤 | 1500 |
・・・ | ・・・ | ・・・ |
表頭の情報がなければ、会員名の列のものは、佐藤、鈴木など、あくまでも文字列でしかありませんね。そこに意味を持たせることにより初めてデータとして価値が出てきます。これらのデータを活用することが、当然のことではありますがデータ活用です。
データの本質を理解しよう
しかも重要なことがもう一点あります。これらのデータはどのようなデータなのか?ということです。難しく感じるかもしれませんが、もう少し紐解いてみましょう。今、仮にあなたがある小売店の社長として上記のデータを手にしていたとしましょう。このデータ自体は、販売データ・購買データですので、お店に来た顧客が購入した結果のデータであります。
課題として「誰がいくら分購入したか購入状況を把握したい」という課題を持っていれば、このデータを集計することにより課題を解決してくれるでしょう。
一方で、解決したい課題として、「購入までの経緯を把握して事前のクロスセルを促進したい」といった場合にはどうでしょう?当然、購買時点でのデータですので、事前の行動をはじめとしたデータは存在しておらず、このデータを利用しても課題を解決することは難しいでしょう。
あくまでも活用としているデータの多くが表層的、具体的な事象を表しているデータであることを理解しましょう。当然、データの入手方法には様々な方法がありますが、多くの場合には各種業務プロセス上、データベースやシステムに蓄積されているデータを活用することが多いでしょう。しかし、先程のようにそれぞれのデータは、顧客の行動のどのような現象を捉えることが可能なデータかということを考える必要があります。
データ分析・活用を前提にしない場合、多くの場合には購買までの過程のデータなどは存在しないことでしょう。また購入後の行動についてもその状況を活用しようと思わない限りデータは存在しません。
まず、今手元にあるデータがどのような種類のデータなのかを把握することが重要であることを理解しましょう。
【参加無料】さわって体験「IBM SPSS Statistics」ハンズオンセミナー

50年以上の歴史を持つ統計解析ソフトウェア「IBM SPSS Statistics」の特徴や活用事例をご紹介する共に実際に皆様に操作を体験いただくハンズオンセミナーです。
SPSS Statisticsの導入を検討されているお客様や、これからデータ分析ソフトウェアをお探しのお客様にわかりやすくご紹介します。