この記事では分散と標準偏差の違いについて解説していきます。どちらも統計用語でデータのばらつきを示すものなのですが、違いを知っている人は少ないんじゃないか。違いはズバリ計算式にあるのですが、統計分析するときは使い分けないといけなのです。
今回はそんな分散と標準偏差の違いを元塾講師の藤沢と分かりやすく解説していきます。

ライター/藤沢 匠

会計事務所勤務をする傍ら副業ライターとして活動中。元塾講師の経験を生かし、数字でお客様の会社を導いている。

分散と標準偏差との違いとは

image by iStockphoto

分散と標準偏差の違いをズバリ言うと2乗するかしないかの違いです。「2乗って何...?」簡単に説明すると同じ数字を2回かける計算をそういいます。例えば3を2回かけたものは3×3=9になって、9は3の2乗になるわけですね。

つまるところ標準偏差の2乗が分散になるわけですが「どうしてわざわざこんな面倒くさいするの?」「そもそも分散の計算式が分からないんだけど,,,」という疑問をお持ちの方、いらっしゃるのではないでしょうか。そんな皆さんのために分かりやすく解説していきます。

分散とは

分散はデータのばらつき具合を示す値のことです。平均値、中央値、最頻値と同じくデータの特徴を説明する統計学の指標になります。「データのばらつきといわれてもイメージできない」「どうしてばらつきを求めないといけないの?」という疑問を感じた方もいらっしゃるのではないでしょうか。具体的にどんな役割があってどうやって求めるのか例を交えて分かりやすく解説していきます。

分散の意味

image by iStockphoto

八百屋さんを例に分散の意味を解説していきますね。上記のような八百屋さんをイメージしてみてください。ニンジンとキャベツの1週間の販売数は以下の通りです。

  ニンジン キャベツ
月  12個      37個
火    9個           40個 
水  11個          34個
木    8個           36個
金  17個          42個
土  20個          45個
日  21個          46個

\次のページで「分散の求め方」を解説!/

ニンジンの平均が14個でキャベツの平均が41個です。キャベツの方がたくさん売れていることが分かりますね。

この八百屋さんの店主になりきって考えてみましょう。どちらが安定して売れているのか気になりませんか。売れている日と売れていない日の差が激しい商品だと余分に仕入れしないと品切れになってしまいますからね。こんな時は分散の出番です。データの数値(野菜の販売数)で分散を計算すると、ばらつきが大きいか数字で分かります。分散の意味が分かったところで次は求め方を見てみましょう。

分散の求め方

ざっくり求め方を説明すると各データから平均を引いて、それを2乗したものの合計をデータ数で割ると分散が求められます。「さっぱり意味がわからない...」という方のためにもう少しかみ砕いて説明していきますね。

ニンジンを例に考えてみましょう。月曜日のニンジンの販売数は12個で平均は14だから(各データの値)-(平均値)=12-14となり答えは-2になります。-2の2乗は(-2)²なので2乗は4になるわけです。全く同じことを残りの火曜日から日曜日までして、2乗した数字すべてを合計してください。

4(月曜日)+25(火曜日)+9(水曜日)+36(木曜日)+9(金曜日)+36(土曜日)+49(日曜日)=168

合計の値は168になりましたね。データ数で割ると分散になりますから、168÷7=24で、分散の値は24個²だと分かります。キャベツの分散も同様に計算してみましょう。答えは18個²になったのではないでしょうか。分散の値が大きいほどデータのばらつきが激しいといえるので、分散値24個²のニンジンの方がばらつきが激しいデータと分かりますね。

キャベツの方が安定して毎日売れている商品で、ニンジンは売れ行きが不安定だと分散が教えてくれました。ばらつき具合が分かる便利な分散ですが、そんな分散には問題点もあります。

分散のメリットと問題点

分散は統計の基礎となる指標でいろいろな公式に使われています。というのも分散はこの後に説明する標準偏差よりも、計算するうえで扱いやすい数字になるためです。分散の平方根になる標準偏差は割り切れないややこしい数字になりやすくて不都合なんですね。

ただ気を付けてください。分散には問題点があるんです。例えば身長の測定をした際にその単位はもちろん[cm]ですよね。一方で分散はデータ値と平均の差を2乗しているためその単位は[cm²] になります。ばらつきを求めるために2乗してしまっているため、分散は元データとは違う単位になっているんです。

対して元データと単位をそろえものが標準偏差になります。単位が同じだから元データの平均値に標準偏差を足したりして統計分析できるんです。次は標準偏差を見てみましょう。

\次のページで「標準偏差とは?」を解説!/

単位が違う数字同士で足し算、引き算はできません。図形の面積(cm²)と直線の長さ(cm)の足し算をするみたいな感じです。それっておかしいですよね。そのため単位をそろえてあげる必要があるんです。

標準偏差とは?

image by iStockphoto

分散についてこれまで解説してきましたが、分散と同じくデータのばらつきが分かる指標に標準偏差があります。そんな標準偏差ですが分散と全く同じというわけではないんです。似て非なる標準偏差を分かりやすく解説していきます。

標準偏差の意味と求め方

標準偏差は分散と同じくデータのばらつき具合が分かる指標ですが、一方で計算式は少し違うんです。分散の平方根が標準偏差になっており、式で表すと分散=標準偏差²になります。

ニンジンとキャベツの分散は24個²、18個²でしたね。標準偏差は分散=標準偏差²なので、それぞれの標準偏差は5.3個、4.6個になります。

標準偏差のメリット

分散とは違い、元のデータと単位が同じなので元のデータや平均値との比較がしやすいのが標準偏差のメリットです。もう一度先ほどの八百屋さんの例で考えてみましょう。

標準偏差を計算したところ、ニンジンは5.3個でキャベツは4.6個でした。分散で比べていた時とは異なり、データのばらつき具合があまり違わない気がしませんか。実はその通りで、分散は単位が違うためデータのばらつき具合が大きく見えがちなんです。一方で標準偏差は単位が同じなので比較したり、説明がしやすい指標になります。

分散と標準偏差を使い分けるポイントは?

Standard deviation diagram.svg
M. W. Toews - 投稿者自身による著作物, based (in concept) on figure by Jeremy Kemp, on 2005-02-09, CC 表示 2.5, リンクによる

うまく割り切れない数字になりがちな標準偏差よりも分散の方が数学、統計学上の計算で活躍します。対して単位が同じ標準偏差は実データを比較して分析したり、説明したりするのに向いているんです。

「そうは言ってもよくわからないよ」という方のために標準偏差の活用例をお見せします。100人の身長の平均が170cm、標準偏差が10cmだとしましょう。これが正規分布というとある条件を満たすのならば、全体の68%が160cm~180cmの身長だとパッと分かります。これは平均値(170cm)±標準偏差(10cm)の範囲に全体の68%のデータが存在するという公式を活用したもの。一方で分散だと単位がcm²なのでこういうことはできないんですね。

分散と標準偏差は統計学の第一歩!

分散も標準偏差も統計学を理解するための基礎になります。統計学は将来起こることを確率で求めたり、相関関係を調べたりする便利なものです。とっつきづらい学問なのは事実ですが、ぜひ活用して皆さんの生活を豊かにしていただければなと思います。

" /> 3分で簡単にわかる!分散と標準偏差との違いとは?求め方や使い分けも元塾講師がわかりやすく解説 – Study-Z
雑学

3分で簡単にわかる!分散と標準偏差との違いとは?求め方や使い分けも元塾講師がわかりやすく解説

この記事では分散と標準偏差の違いについて解説していきます。どちらも統計用語でデータのばらつきを示すものなのですが、違いを知っている人は少ないんじゃないか。違いはズバリ計算式にあるのですが、統計分析するときは使い分けないといけなのです。
今回はそんな分散と標準偏差の違いを元塾講師の藤沢と分かりやすく解説していきます。

ライター/藤沢 匠

会計事務所勤務をする傍ら副業ライターとして活動中。元塾講師の経験を生かし、数字でお客様の会社を導いている。

分散と標準偏差との違いとは

image by iStockphoto

分散と標準偏差の違いをズバリ言うと2乗するかしないかの違いです。「2乗って何…?」簡単に説明すると同じ数字を2回かける計算をそういいます。例えば3を2回かけたものは3×3=9になって、9は3の2乗になるわけですね。

つまるところ標準偏差の2乗が分散になるわけですが「どうしてわざわざこんな面倒くさいするの?」「そもそも分散の計算式が分からないんだけど,,,」という疑問をお持ちの方、いらっしゃるのではないでしょうか。そんな皆さんのために分かりやすく解説していきます。

分散とは

分散はデータのばらつき具合を示す値のことです。平均値、中央値、最頻値と同じくデータの特徴を説明する統計学の指標になります。「データのばらつきといわれてもイメージできない」「どうしてばらつきを求めないといけないの?」という疑問を感じた方もいらっしゃるのではないでしょうか。具体的にどんな役割があってどうやって求めるのか例を交えて分かりやすく解説していきます。

分散の意味

image by iStockphoto

八百屋さんを例に分散の意味を解説していきますね。上記のような八百屋さんをイメージしてみてください。ニンジンとキャベツの1週間の販売数は以下の通りです。

  ニンジン キャベツ
月  12個      37個
火    9個           40個 
水  11個          34個
木    8個           36個
金  17個          42個
土  20個          45個
日  21個          46個

\次のページで「分散の求め方」を解説!/

次のページを読む
1 2 3
Share: