標準偏差をエクセルで求める方法と完璧なグラフの作り方！

近年、よく耳にするようになった「ビッグデータ」「機械学習」「データサイエンス」といったテクノロジー。これらに共通しているのは、「膨大なデータが出力される」という点です。

そして、そのデータの統計をとるうえでは、「標準偏差」「分散」のような値が欠かせません。

こちらでは、データのばらつきが可視化できる標準偏差の定義や、エクセルでの求め方、グラフの作成方法などについてご紹介します。

＼文字より動画で学びたいあなたへ／

Udemyで講座を探す＞

INDEX

標準偏差とは何か？　分散との違いもわかる
標準偏差を使えば何がわかるの？　具体例で解説
標準偏差をエクセルで求める方法（ＳＴＤＥＶ.Ｐ関数）
エクセルで標準偏差を求める時に必要なＳＴＤＥＶ.ＰとＳＴＤＥＶ.Ｓの違いとは？
エクセルで求めた標準偏差を適切なグラフで表現する方法

標準偏差とは何か？　分散との違いもわかる

標準偏差とは、統計学の分野において複数データ間のばらつきの大きさを示す値です。一般的にσ（シグマ）、もしくは5で表され、算出には以下の公式を用います。

各データの数値からデータ全体の平均を差し引いた値の二乗を合計し、さらにデータの総数で割った値の正の平方根が標準偏差です。

標準偏差と同じようにデータのばらつきを示す「分散」という値が存在します。基本的な公式の成り立ちはまったく同じですが、標準偏差が最終的に正の平方根を求めるのに対し、分散の算出では平方根を求めません。つまり、分散は標準偏差を二乗した値ということになります。

標準偏差は最終的な単位がデータと同次元ですが、分散は単位についても二乗となります。そのため、現実に存在するデータのばらつきを測定する際は、データと同次元でイメージがしやすい標準偏差が用いられる傾向があるようです。

＼文字より動画で学びたいあなたへ／

Udemyで講座を探す＞

標準偏差を使えば何がわかるの？　具体例で解説

標準偏差でわかるのは、複数データ間における特定データの希少性や優劣です。今回は２つの例を紹介します。

【ケース①】テストの点数の標準偏差

例として、複数人のテストの点数を比較するケースを想定してみます。

名前	テストの点数
A	32点
B	85点
C	74点
D	53点
E	66点

平均点	62点

A～Eの５人のテストの平均は62点となっています。平均点を超えているのは、B、C、Eの３人です。

この時、標準偏差を求めると、

となりますから、比較的データのばらつきは大きいと判断できます。

つまり、Cは平均点を超えているが、それほどすごくないと考えられます。

逆にDのように53点でも、あまり気にしなくても良いと判断できます。

標準偏差が小さい場合には、ばらつきが少ないため、平均点を上回っている人は、すごいと判断できます。

【ケース②】複数支店の売上比較

続いて例として、複数支店の売り上げを比較するケースを想定してみます。

支店名	売上金額
A	¥3,000,000
B	¥4,500,000
C	¥2,000,000
D	¥800,000
E	¥1,000,000
F	¥6,000,000
売上合計	¥17,300,000

売り上げ平均	¥2,883,333

この表を見る限り、支店Aの売り上げは各支店の平均値を突破しており、優秀に見えます。しかし、単純に統計データの総和をサンプル数で割った平均値から特定データの優劣を判断する考え方は、必ずしも正しくありません。

一部支店が、高い売り上げを出していたとしても、多くの支店の低い売り上げによって平均が下げられているケースが考えられます。このようなケースでは、平均よりも売り上げている店舗を称賛するよりも、売り上げの低い店舗を問題視しなければなりません。

店舗Aの売り上げが本当に優秀な数字かどうかは、標準偏差からわかります。標準偏差の値が小さければ、店舗Aは激しい競争のなかで平均以上の売り上げをたたき出した優秀な店舗ということです。対して標準偏差の値が大きければ、一部の店舗が平均を下げているだけで、店舗A以上の売り上げを出している店舗はたくさんあるということになります。

例としてあげた表の場合、標準偏差は約1,871,120円（桁が大きいため、以降の章で求め方は説明します）。全体的にばらつきが大きく、平均を越えているからといって店舗Aの売り上げを手放しで評価できないことがわかります。

標準偏差をエクセルで求める方法（ＳＴＤＥＶ.Ｐ関数）

標準偏差を、手計算で算出するのは時間がかかります。一方、エクセルを用いれば、もととなるデータさえあれば簡単なやり方で算出可能です。「STDEV関数」を使った、標準偏差の算出方法をご説明しましょう。

１．もととなるデータを入力し、標準偏差を入力したいセルを選択します。

２．目的のセルが選択されたままの状態で上部のfxアイコンをクリックし、P関数を見つけましょう。「標準偏差」と検索すると簡単です。STDEV.P関数を選択したら、「OK」をクリックしてください。

３．関数の引数として、各データを指定しましょう。表のデータをドラッグするだけです。

４．最後に「OK」をクリックすれば、指定していたセルに標準偏差の値が入力されます。

エクセルで標準偏差を求める時に必要なＳＴＤＥＶ.ＰとＳＴＤＥＶ.Ｓの違いとは？

STDEV関数には、上述した方法で紹介したSTDEV.Pのほか、「STDEV.S」が存在します。どちらも平均値からのばらつきを求める関数として定義されていますが、使い分けが必要です。引数として指定されたデータのばらつきを求めるSTDEV.Pに対しSTDEV.Sはデータの抽出もとの母集団におけるばらつきの推定値が算出できます。

多数の店舗のなかから無作為に選びだした対象のみについて売り上げのばらつきを求めたい場合は、STDEV.Pを用います。対して、店舗全体における売り上げのばらつきを推定したい場合に用いるのがSTDEV.Sです。