Excel(エクセル)でのデータ分析の関数の1つですね。今回は標準正規分布になるデータから累積分布確率や確率質量関数を求める事が出来る『NORM.DIST(ノーマルディストリビューション)』と『NORMDIST(ノーマルディストリビューション)』関数についてと、データを標準化した値から累積分布確率と確率密度関数を計算出来る『NORM.S.DIST(ノーマルスタンダードディストリビューション)』と『NORMSDIST(ノーマルスタンダードディストリビューション)』関数の4つについて紹介します。
それぞれ正規分布のデータの分析に活用出来るので使い方をチェックして行きましょう!
目次
標準正規分布と標準化って何だろう?
さてデータの分布ではたびたび出て来るのが標準正規分布という言葉ですね。よく聞くなぁって人も多いのではないでしょうか?ではそれってどんな分布なのでしょうか?
例えばあるクラスの点数をそれぞれの点数の範囲に何人いるのかを考えてみたとします。平均点が70点だったとした時に、大体70点の所の人数が多くそこから点数が離れていて行くと徐々に人数が減っていく様な分布になったりしますね。グラフにすると平均値の付近が一番多い山形のグラフになる訳ですね。
これが標準正規分布というやつですね。
では標準化って何でしょうか?これはデータを比べる時に考える物ですが、例えば再びテストの点数で考えてみた時に平均点70点のテストでとった80点と平均点50点の中でとった80点ではどちらの方がすごいかって事ですね。平均点が低い中でとった80点の方がすごいって感じると思います。どっちがどのくらいすごいのかというのを数値で表したのが標準化した数値って事になります。大まかな説明になりますがどんな物なのかイメージ出来れば大丈夫です。
Excelで累積分布関数と確率質量関数の計算『NORM.DIST』と『NORMDIST』で求めてみよう!
では実際に標準正規分布の累積分布関数と確率質量関数を計算してみましょう。
累積分布関数は指定した数値が全体の何%の部分にあたる数値になっているかの数値になり、確率質量関数は指定した数値が全体の何%を占めているかを表す数値になります。
『NORM.DIST』や『NORMDIST』を活用する事によりこれらの確率質量関数と累積分布関数を計算する事が出来る訳なんですね。
関数の書き方は次の感じになります。
関数式:『=NORM.DIST(x、平均、標準偏差、関数形式)』
関数式:『=NORMDIST(x、平均、標準偏差、関数形式)』
どちらも同じ引数の内容になっていますね。2つの違いはExcelのバージョンによる違いで、『.』がついている『NORM.DIST』の方が新しいバージョンで出て来た関数になります。やりたい事は同じではあるんですが、新しい方を活用する様に推奨されているので、新しい方を使って行く事にしましょう。
そして、関数形式には『TRUE』と『FALSE』のどちらかが入ります。
『TRUE』であれば『累積分布関数』、『FALSE』であれば『確率質量関数』の計算という事になります。違いに気を付けてくださいね。
Excelで正規分布の累積分布関数を『NORM.DIST』及び『NORMDIST』で出してみる!
では初めに『NORMDIST』と『NORM.DIST』で実際に計算をやってみる事にしましょう。
計算したい内容はどちらを使っても同じになりますのでどっちもやってみます。
今回は累積分布関数を計算しますので、関数形式としては『TRUE』を指示する事になる所に気を付けましょう!
必要なデータは累積分布を求めたい数値、正規分布の平均値と標準偏差になります。
関数の書き方としては『=NORM.DIST(B1、B2、B3、TRUE)』って事になりますね。
これが累積分布関数の結果になります。
割合的には65%くらいの位置になりますよって事になる訳ですね。
同様に『NORMDIST』でもやってみます。
関数は『=NORMDIST(B1、B2、B3、TRUE)』ですね。
結果も同じ数値になっているのが分かりますね。
Excelで確率質量関数を『NORM.DIST』と『NORMDIST』で計算してみる!
ではもう一つの形式を使って確率質量関数を計算してみましょう!
今回の場合の関数形式としては『FALSE』を指示する事になる所に気を付けましょう!
必要なデータはさっきと同じ様に確率質量関数を求めたい数値、正規分布の平均値と標準偏差になります。
関数の書き方としては『=NORM.DIST(B1、B2、B3、FALSE)』って事になりますね。
完成ですね。これが確率質量関数の結果になります。
指定した数値が分布の中でこのくらいの割合を占めているって結果ですね。
同様に『NORMDIST』でもやってみます。
関数は『=NORMDIST(B1、B2、B3、FALSE)』ですね。
結果も同じ数値になっているのが分かりますね。
Excelで標準化した数値の累積分布関数と確率密度関数の計算『NORM.S.DIST』と『NORMSDIST』で求めてみよう!
ではこの次は『NORM.S.DIST』と『NORMSDIST』を活用する事にしましょう。
こちらは標準化したデータに対して確率密度関数と累積分布関数を計算する事が出来る関数になります。
標準化というのは、データを平均値0、標準偏差1とした分布に当てはめた時にいくつになるかの数値になります。
標準化の計算では
『(数値 ― 平均)÷ 標準偏差』
で計算をします。関数ではこの値が『z』という引数で使われますよ
関数の計算は次の様な感じになります
関数式:『=NORM.S.DIST(z、関数形式)』
関数式:『=NORMSDIST(z、関数形式)』
『z』は標準化した数値になりますね。
関数形式の所で『TRUE』で『累積分布関数』、『FALSE』で『確率密度関数』を計算する事が可能になっています。
Excelで累積分布関数を『NORM.S.DIST』と『NORMSDIST』で計算してみる!
では初めに『NORMSDIST』と『NORM.S.DIST』で実際に計算をやってみる事にしましょう。
計算したい内容はどちらを使っても同じになりますのでどっちもやってみます。
今回は累積分布関数を計算しますので、関数形式としては『TRUE』を指示する事になる所に気を付けましょう!
あらかじめ関数に必要な数値の『z』を求めておきます。
z=(数値 ― 平均値)/ 標準偏差
で出しておきましょうね。
関数の書き方としては『=NORM.S.DIST(B4、TRUE)』って事になりますね。
これが累積分布関数の結果になります。
同様に『NORMSDIST』でもやってみます。
関数は『=NORMSDIST(B4、TRUE)』ですね。
結果も同じ数値になっているのが分かりますね。
Excelで確率密度関数を『NORM.S.DIST』で計算してみる!
ではもう一つの形式を使って確率密度関数を計算してみましょう!
今回の場合の関数形式としては『FALSE』を指示する事になる所に気を付けましょう!
必要なデータの『z』はさっきと同じ様に出しておきましょう。
関数の書き方としては『=NORM.S.DIST(B4、FALSE)』って事になりますね。
完成ですね。これが確率密度関数の結果になります。
指定した数値が分布の中でこのくらいの割合を占めているって結果ですね
『NORMSDIST』では確率密度の計算は出来ません。
そこが違う部分になりますかね。
Excelで標準正規分布の累積分布確率を求める【NORM.DIST】【NORMDIST】【NORM.S.DIST】【NORMSDIST】関数の使い方|【まとめ】
Excelで標準正規分布のデータ分析の関数として『NORM.DIST』『NORMDIST』『NORM.S.DIST』『NORMSDIST』の4つについて紹介しました。
バージョン違いによる使い分けというのもありましたね。今回は標準正規分布のデータをそのまま活用しての計算なのか、標準化させてから計算するのかの違いがありました。
そのままのデータで計算する時にはNORM.DIST』『NORMDIST』を使いますし、標準化した場合には『NORM.S.DIST』『NORMSDIST』を使う事になりますね。
標準化のデータの求めるやり方についてもチェックをしておいてくださいね。
どんなデータで計算するのかに合わせて関数を使い分けられる様にしておきましょう!