知っておきたい統計学超入門:第2回:統計には種類がある
第2回:統計には2つの種類がある?
みなさんこんにちは。スマート・アナリティクスの代表の畠です。
前回は、統計の歴史的な背景についてご紹介をしてきました。今回は、統計についてさらに深堀をしてきましょう。
知っておきたい統計学超入門~文系のための0からはじめる統計~第1回:統計(学)とは何か? ~歴史的な背景から探る~
統計のはじまりは「測ること」
統計のもっとも根源としての考えは、物事を観測して「測る」ことです。厳密には、「測る」には、数えることと何ならかの計算することの二つがあります。その中から、何ならの法則性や規則性を発見したり、それを記載・記述したり、また検証することが統計のもっとも基本的な役割といえます。
また、統計は集団の行動や意識を扱います。そのため統計においては、個々人の嗜好や行動などはあまり関心がありません。集団や事象の思考や状態がどうなのかに関心があり、それを調べるための道具が統計です。
母集団と標本(サンプル)
さて、統計の基本的な考え方は、「データ自体はすべて収集することができないから一部を収集して、その一部のデータから全体を考えてみよう」という発想がベースとなっています。 たとえば、アンケートを実施し国民の意識調査を実施する場合、日本国民1億2600万人すべてから回答を得ることは困難です。そのために一部の人、たとえば1000人にアンケートを実施し、日本人の意識を探るわけです。
このとき、日本国民すべてのような、そのデータの大元となる集団のことを「母集団」、アンケートをとった1000人を「標本もしくはサンプル」といいます。
統計の種類:記述統計と推測統計
統計解析には、大きく分けて2つの種類があります。それは、記述統計と推測統計です。
データからその特徴を表現する「記述統計」とデータから全体などを予測する「推測統計」
記述統計は、手元にあるデータ(これを標本またはサンプルといいます)、つまり標本からその特徴をグラフや数字を使って表します。記述統計は、母集団との関係性を考える必要はありません。あくまでも手元のデータから何か特徴を見つけ出す手法です。
平均値や中央値というような、そのデータを代表する値を利用するのと同時にグラフや表を利用します。
もう一つの手法が推測統計です。たとえば、ある国の一つの畑の収穫高から国家全体の収穫高を予測したり、わずか1000人程度のアンケート調査から国民全体の傾向を考えたりする、これが推測統計です。
さらに、推測統計には推定と検定の2つの考え方があります。先ほどの例のように一部のサンプルから全体を計算することを推定といいます。それに対し、手元にある分析結果が母集団でも成り立つかどうかを確認することを検定といいます。この推定と検定が推測統計のポイントです。
このように統計解析は、データの特徴を明らかにしたり、一部のデータから全体を予測したり、一部の結果から全体の傾向を確認したりすることができるのです。