分析手法完全ガイド

標準偏差と分散とは？違いと求め方・n−1の意味・SPSSでの算出までやさしく解説

Q: 標準偏差と分散は、どちらを使えばよいですか？

結果を人に伝えたり解釈したりするときは標準偏差を使います。単位が元のデータと同じでイメージしやすいからです。分散は計算の途中や、分散分析のように二乗和を扱う手法の中で使われます。

Q: 標準偏差と標準誤差は何が違いますか？

標準偏差は個々のデータのばらつき、標準誤差は標本平均という推定値のばらつきです。SE = SD ÷ √n の関係があり、データの数が多いほど標準誤差は小さくなります。

Q: 外れ値があるデータでも標準偏差を使ってよいですか？

使えますが、外れ値がひとつあるだけで値が大きくふくらむ点に注意してください。歪んだ分布や外れ値が多いデータでは四分位範囲も併せて見ることをおすすめします。

Q: 標準偏差の値は、どれくらいだと「大きい」と言えますか？

絶対的な基準はありません。平均に対する比率（変動係数＝標準偏差÷平均）や、同じ尺度で測った過去のデータ・他のグループとの比較で判断します。

読了の目安約14分 難易度はじめての方OK 最終更新2026.07.02

標準偏差とは、データが平均のまわりにどれくらいばらついているかを、元のデータと同じ単位で表す指標です。分散はばらつきを二乗のまま表した値で、標準偏差は分散の平方根（√分散）にあたります。

みなさん、こんにちは。スマート・アナリティクスの畠です。標準偏差と分散は、どちらも「データがどれくらいばらついているか」を表す数値です。名前が似ていて混乱しやすいのですが、違いはとてもシンプルで「単位」だけ。分散は計算しやすいように二乗したままの値、標準偏差はその平方根をとって元の単位に戻した値です。このページでは、つまずきやすいところを先回りしながら、定義と数式の意味、標本分散をn−1で割る理由、68-95-99.7ルールの使い方、SPSSでの求め方までを、順番にていねいに見ていきます。

畠

畠慎一郎スマート・アナリティクス株式会社代表取締役経営学修士を取得後、統計解析ソフトウェアのSPSS社に入社。IBM社のSPSS社買収に伴い日本アイ・ビー・エム株式会社に入社し、SPSS製品をはじめとするデータ分析・ビジネス・アナリティクス製品の製品マーケティング・戦略立案を担当。2015年よりセールスフォース・ドットコムにて現在のEinstein Analytics（旧 Wave Analytics）の日本市場における製品責任者として参画。2019年3月より現職。著書『武器としてのデータ分析力』『SPSS超入門』『文系ビジネスパーソンのためのデータ分析入門』。総務省統計局「社会人のためのデータサイエンス講座」講師も務める。

このページの要点

標準偏差と分散は、どちらも「データのばらつき」を表す。違いは単位だけ
分散は計算しやすい二乗のままの値。標準偏差はそれを元の単位に戻した値
標本分散を n−1 で割るのは、自由度を補正して母分散を正しく見積もるため（不偏分散）
正規分布に近いとき、標準偏差は「68-95-99.7ルール」というものさしになる

このページの目次開く / 閉じる ▾

標準偏差と分散で何が分かるのか
分散とは何か——定義・求め方・具体例
標準偏差とは何か
なぜ標本分散は n−1 で割るのか
標準偏差の解釈：68-95-99.7ルール
母集団と標本──記号の使い分け
関連するばらつき指標との違い
SPSSでの求め方
関連分析手法・SPSS実装ガイド
つまずきやすいポイントと注意点
よくある質問

標準偏差と分散で何が分かるのか

平均値は、データの「真ん中」を教えてくれます。でも、平均だけではデータの姿は半分しか見えません。

たとえば、平均点が同じ60点のテストでも、クラスの全員が58〜62点に固まっている場合と、30点台の人と90点台の人に分かれている場合とでは、まったく様子が違いますよね。前者は実力がそろっていて、後者は大きく差が開いている。この「真ん中からの散らばり具合」をひとつの数値にまとめてくれるのが、分散と標準偏差です。

標準偏差と分散が答えてくれるのは、「データは平均の近くにギュッと集まっているのか、それとも広く散らばっているのか」という問いです。値が小さいほどデータは平均の近くに密集し、大きいほど広く散らばっています。

ここがポイント
平均は「どこを中心にしているか」、標準偏差・分散は「どれくらい広がっているか」。この2つはセットで、はじめてデータの姿を語れます。どちらか一方だけでは、いつも半分しか見えていないと考えてください。

分散とは何か——定義・求め方・具体例

分散とは、データの散らばりの大きさを、平均からの差（偏差）を二乗して平均した値で表す指標です。英語では variance と呼びます。それぞれのデータが平均からどれだけ離れているか——その「離れ具合」をひとつの数値に集約したものが分散で、値が大きいほどデータは広く散らばり、小さいほど平均の近くに集まっています。

母分散　　σ² = Σ(xᵢ − μ)² ÷ N
標本分散　s² = Σ(xᵢ − x̄)² ÷ (n − 1)

μ は母平均、x̄ は標本平均、N・n はデータの個数です。式が少し難しく見えるかもしれませんが、考え方を順番に追えば大丈夫です。

なぜ「差」をそのまま足さないのか

ばらつきを測るなら、それぞれのデータと平均の差（偏差）を全部足せばよさそうに思えます。ところが、偏差をそのまま合計すると、必ずゼロになってしまいます。平均より上にある分と下にある分が、ちょうど打ち消し合うからです。これではばらつきの大きさを測れません。

なぜ「二乗」するのか

打ち消し合いを防ぐ方法は二つあります。絶対値をとる方法と、二乗する方法です。統計学が二乗を選んだのは、二乗した量のほうが数学的に扱いやすく、後に学ぶ多くの手法ときれいにつながるからです。分散分析・回帰分析など、これから出会う手法の多くは、この「二乗和」の考え方の上に組み立てられています。

分散を実際に計算してみる——5人の小テストの例

定義だけではイメージがわきにくいので、私と一緒に小さなデータで手を動かしてみましょう。5人の学生が10点満点の小テストを受けて、4点・6点・7点・8点・10点だったとします。平均は (4+6+7+8+10) ÷ 5 = 7点です。ここから分散を求める手順は、表にすると一目で追えます。

学生	点数	偏差（点数 − 平均7）	偏差の二乗
Aさん	4	−3	9
Bさん	6	−1	1
Cさん	7	0	0
Dさん	8	+1	1
Eさん	10	+3	9
合計	35	0	20

偏差の合計が0になっていること、二乗すると打ち消し合いが消えることを、表の中で確かめてください。偏差二乗和は20なので、分散は次のようになります。

5人を母集団全体とみなす場合（母分散）　σ² = 20 ÷ 5 = 4
5人をより大きな集団からの標本とみなす場合（不偏分散）　s² = 20 ÷ (5 − 1) = 5

どちらの分母を使うかは、データを「全体」とみなすか「標本」とみなすかで決まります。この使い分けと n−1 の理由は、後のセクションでくわしく説明します。ちなみに不偏分散5の平方根をとると、標準偏差は √5 ≒ 2.24点です。

ここがポイント
分散の計算は「偏差を出す → 二乗する → 平均する」の3手順だけです。一度この小さな表を自分の手で書いてみると、数式 Σ(xᵢ − x̄)²/(n−1) が「あの表の手順を記号で書いただけ」だと実感できます。

分散はどこで使われるのか

「結果の解釈には標準偏差を使うのなら、分散の出番はどこにあるのですか？」と聞かれることがあります。よい質問です。分散は、レポートの表面にはあまり登場しませんが、統計手法の内部では主役級の働きをしています。

分散分析（ANOVA）——その名のとおり、グループ間とグループ内の分散を比べて平均の差を検定します。F値は分散の比です。くわしくは分散分析のガイドへ
等分散性の確認——t検定や分散分析では、グループ同士の分散が大きく違わないか（等分散性）を前提として確認します
共分散・相関係数——分散の考え方を2つの変数に広げたものが共分散で、相関分析の土台になります
偏差値・標準化——分散の平方根である標準偏差を介して、zスコアや偏差値の計算につながります

つまり、分散は「それ自体を報告する数値」というより、「この先に学ぶ手法たちの共通部品」です。ここで手順と意味をつかんでおくと、t検定・分散分析・回帰分析と進んだときに、式の中の分散が旧友のように見えてきます。

ただ、二乗したことで単位も二乗されてしまいます。テストの点数（点）の分散は「点²」という、ちょっと想像しにくい単位になります。この使いにくさを補ってくれるのが、次に出てくる標準偏差です。

図1　同じ平均でも、散らばり方が違えばデータの意味は変わる

図1平均が同じでも、標準偏差が小さければ平均の近くに密集し、大きければ広く散らばります。

標準偏差とは何か

標準偏差（standard deviation）は、分散の正の平方根です。

標準偏差　σ = √σ²　（標本では s = √s²）

平方根をとると、単位が元に戻ります。テストの点数なら、標準偏差の単位も「点」です。「平均70点、標準偏差8点」と言われれば、だいたい62〜78点あたりに多くの人が散らばっているな、とすぐにイメージできます。これは「分散64点²」と言われても、なかなか思い浮かばないものです。

学ぶうえでは、計算の途中では分散を使い、結果を読み取ったり説明したりするときには標準偏差を使う、という流れを覚えておくと迷いません。両者は同じことを別の単位で表しているだけで、対立する指標ではありません。

ワンポイント
レポートや論文では「M = 70.2, SD = 8.1」のように、平均（M）と標準偏差（SD）をセットで書くのが決まった形です。分散をそのまま書く場面は、分散分析の結果表など、限られています。

なぜ標本分散は n−1 で割るのか

学びはじめた方がいちばん「なぜ？」と立ち止まるのが、標本分散の分母です。データが n 個あるのに、どうして n ではなく n−1 で割るのでしょうか。授業や相談の場で、私はこの質問を本当に何度も受けてきました。

理由は「自由度（degrees of freedom）」の補正です。標本分散を計算するとき、私たちは母平均 μ を知らないので、代わりに標本平均 x̄ を使います。ところが標本平均は、そのデータ自身から計算した値なので、データに少し「寄り添って」います。その結果、x̄ のまわりで測った偏差二乗和は、本当の μ のまわりで測ったときより、構造的に小さくなってしまいます。

このまま n で割ると、母分散をいつも小さめに見積もることになります。これを補うために、分母をひとつ小さい n−1 にして、値をほんの少し大きくします。x̄ をひとつ推定に使ったことで、データが自由に動ける数が n から n−1 に減った——これが「自由度が1失われる」という言い回しの意味です。n−1 で割って得られる分散は、母分散をかたよりなく推定してくれるので、不偏分散と呼ばれます。

気をつけたいこと
データの個数が多いほど、n と n−1 の差はほとんど気にならなくなります（n=1000 なら差は0.1%）。補正が効いてくるのは、データが少ないときです。SPSSの「記述統計量」が出す分散・標準偏差は、はじめから n−1 ベース（不偏）になっています。

SPSSでの実際の操作は「使い方」シリーズで

本ガイドは考え方の解説です。SPSS画面での記述統計量の求め方は連載でていねいに紹介しています。

SPSSの使い方シリーズ →

標準偏差の解釈：68-95-99.7ルール

データが正規分布に近いとき、標準偏差は分布をはかる「ものさし」として、とても頼りになります。

範囲	含まれるデータの割合
平均 ± 1SD	約68.3%
平均 ± 2SD	約95.4%
平均 ± 3SD	約99.7%

これを68-95-99.7ルール（経験則）と呼びます。平均70点・標準偏差8点のテストなら、約68%の人が62〜78点、約95%の人が54〜86点に収まる、と読み替えられます。

このルールは、極端な値（外れ値）を見つけるときにも役立ちます。平均から3SD以上離れた値は、出てくる確率が0.3%にも満たないので、「これはかなり珍しい値だ」と判断できます。ただし、この読み方は分布が正規分布に近いことが前提です。分布が大きく歪んでいるときは割合がずれてしまうので、まずヒストグラムなどで分布の形を確かめてから使ってください。

母集団と標本──記号の使い分け

分散・標準偏差は、対象が母集団なのか標本なのかで、記号と分母が変わります。混乱しやすいところなので、表で整理しておきましょう。

区分	平均	分散	標準偏差	分母
母集団	μ	σ²	σ	N
標本	x̄	s²	s	n − 1

調査や研究で実際に手元にあるのは、ほとんどの場合「標本」です。ですから、みなさんが計算するのは標本分散・標本標準偏差（n−1ベース）だと考えて、まず差し支えありません。母集団そのものをまるごと把握できるのは、かなり例外的な場面です。

指標	何を測るか	向いている場面	外れ値への強さ
標準偏差 / 分散	平均からの散らばり	分布が左右対称に近いとき	弱い（敏感）
範囲（レンジ）	最大値 − 最小値	ばらつきをざっくりつかむ	とても弱い
四分位範囲（IQR）	真ん中50%の幅	歪んだ分布、外れ値が多いとき	強い
変動係数（CV）	標準偏差 ÷ 平均	単位や平均が異なるデータの比較	弱い
標準誤差（SE）	標本平均のばらつき	平均値の推定の精度を示すとき	弱い

SPSSでの求め方

IBM SPSS Statistics では、「分析」→「記述統計」→「記述統計量」を選び、対象の変数を指定して「オプション」で標準偏差・分散にチェックを入れると求められます。「度数分布表」や「探索的」のメニューからも出せます。

出力表で「標準偏差」と表示される値は不偏（n−1ベース）です。これを二乗すれば分散と一致します。あわせて歪度・尖度も出しておき、68-95-99.7ルールを当てはめてよい分布の形かどうかを確かめておくと安心です。標準偏差・分散は、t検定・分散分析・回帰分析など多くの手法の内部で使われる基礎の数値なので、本格的な分析の前に「まず記述統計量を出す」のがおすすめの進め方です。SPSSの具体的な画面操作は「SPSSの使い方」シリーズでくわしく解説しています。

標準偏差・分散と関連の深い分析手法・SPSSでの具体的な実装手順を以下にまとめます。研究設計や論文執筆の参考にあわせてご活用ください。

つまずきやすいポイントと注意点

「標準偏差が小さい＝良い」とはかぎりません
ばらつきが小さいほうが望ましい場面もあれば、ばらつきそのものを知りたい場面もあります。小さければ良い、という思い込みは手放しておきましょう。

外れ値に弱いことを知っておきます。標準偏差は偏差を二乗するので、極端な値がひとつあるだけで大きくふくらみます。外れ値が疑われるデータでは、四分位範囲を併せて見るか、外れ値をどう扱うかを先に決めてください。

単位が違うデータを標準偏差で直接比べないようにします。身長（cm）の標準偏差と体重（kg）の標準偏差を「どちらが大きい」と比べても、意味がありません。単位をまたいで比べたいときは、変動係数を使います。

正規分布を前提にした読み方に注意します。68-95-99.7ルールは、分布が正規分布に近いときの経験則です。分布が大きく歪んでいるときは、この割合は成り立ちません。

よくある質問

Q標準偏差と分散は、どちらを使えばよいですか？▾

結果を人に伝えたり、解釈したりするときは標準偏差を使います。単位が元のデータと同じで、イメージしやすいからです。分散は計算の途中や、分散分析のように二乗和を扱う手法の中で使われます。情報としては同じで、使う場面が違うだけです。

Qなぜ標本分散は n−1 で割るのですか？▾

標本平均を推定に使った分、自由度が1減るためです。n で割ると母分散を小さめに見積もってしまうので、n−1で割って補正します。この補正後の値を不偏分散と呼びます。

Q標準偏差と標準誤差は何が違いますか？▾

標準偏差は「個々のデータのばらつき」、標準誤差は「標本平均という推定値のばらつき」です。SE = SD ÷ √n の関係があり、データの数が多いほど標準誤差は小さくなります。

Q標準偏差がゼロになることはありますか？▾

あります。すべてのデータが同じ値のとき、偏差がすべてゼロになり、分散も標準偏差もゼロになります。「ばらつきがまったくない」状態です。

Q外れ値があるデータでも標準偏差を使ってよいですか？▾

使えますが、外れ値がひとつあるだけで値が大きくふくらむ点に注意してください。歪んだ分布や外れ値が多いデータでは、四分位範囲（IQR）も併せて見ることをおすすめします。

Q標準偏差から偏差値はどう計算しますか？▾

偏差値 = (個人の得点 − 平均) ÷ 標準偏差 × 10 + 50 です。平均を50、標準偏差を10にそろえた標準化得点で、Zスコアを10倍して50を足したものにあたります。

Q分散とは何ですか？簡単に教えてください。▾

分散とは、データの散らばりの大きさを、平均からの差（偏差）を二乗して平均した値で表す指標です。値が大きいほどデータは広く散らばり、小さいほど平均の近くに集まっています。分散の平方根をとって元の単位に戻したものが標準偏差です。

Q分散がマイナスになることはありますか？▾

ありません。分散は偏差を二乗した値の平均なので、必ず0以上になります。最小値の0になるのは、すべてのデータが同じ値でばらつきがまったくないときです。計算結果がマイナスになった場合は、どこかに計算ミスがあります。

Q分散の単位はどうなりますか？▾

元のデータの単位を二乗したものになります。たとえばテストの点数（点）の分散は「点²」、身長（cm）の分散は「cm²」です。そのままでは直感的に読みにくいため、結果を解釈・報告するときは平方根をとって単位を元に戻した標準偏差を使うのが一般的です。

Q標準偏差の値は、どれくらいだと「大きい」と言えますか？▾

絶対的な基準はありません。単位や平均の大きさによって変わるためです。平均に対する比率（変動係数＝標準偏差 ÷ 平均）に直したり、同じ尺度で測った過去のデータや他のグループと並べて比べたりして判断します。テストの点数なら、前回の試験や他のクラスの標準偏差と見比べるのが実用的です。

QExcelで標準偏差を求めるには、どの関数を使えばよいですか？▾

標本から母集団のばらつきを推定する通常の場面では STDEV.S 関数（n−1で割る不偏ベース）を使います。手元のデータ全体がそのまま母集団なら STDEV.P 関数（nで割る）です。SPSSの「記述統計量」が出力する標準偏差は STDEV.S と同じ計算（n−1ベース）です。

Q論文でよく見る「平均±標準偏差（M±SD）」はどういう意味ですか？▾

データの中心（平均：M）とばらつき（標準偏差：SD）をセットで示す書き方です。分布が正規分布に近ければ、「平均±1SD」の範囲に全体の約68%のデータが収まる、という読み方ができます。論文やレポートでも、平均を書くときは標準偏差とデータ数（n）を添えるのが基本です。

Q標準化（Zスコア）とは何ですか？標準偏差とどう関係しますか？▾

個々の値から平均を引き、標準偏差で割った値がZスコアです。「平均から標準偏差いくつ分離れているか」を表すため、単位の違う変数どうし（身長と数学の点数など）を同じものさしで比べられるようになります。偏差値は、このZスコアを10倍して50を足したものです。

基礎から体系的に学ぶなら「はじめてのSPSS超入門」

本ガイドの内容を含む統計の基礎とSPSSの操作を、講師と一緒に集中して学べる講座です。ライブ配信版と、好きな時間に学べるオンデマンド版があります。

ライブ講座 →

解析の進め方に迷ったら、専門家にご相談ください。

「自分のデータでどう使えばいい？」「論文のこの部分が不安」——統計解析の専門スタッフが個別にお答えします。

30分の無料オンライン相談

「自分のデータでどう使えばいい？」をお気軽にご相談ください

→