Excel(エクセル)の関数で超幾何分布の確率を求める時には『HYPGEOM.DIST』あるいは『HYPGEOMDIST』関数を使います。関数は『ハイパージオメトリック・ディストリビューション』といいます。この関数は統計などでデータの解析、分析をする際に使用出来る関数になります。超幾何分布とは何でしょうか?たくさんある標本の中からデータを取り出した時に、決めたデータがどのくらいの確率でとれるかという事になります。今回は、簡単にどんな場合に活用出来るか、『HYPGEOM.DIST』という関数と『HYPGEOMDIST』関数の異なる部分についての確認と関数を活用する場合の作成方法について紹介します。
『HYPGEOM.DIST』と『HYPGEOMDIST』関数の説明動画はこちら↓↓
目次
『HYPGEOM.DIST』と『HYPGEOMDIST』関数で計算する超幾何分布って?
Excelの関数の活用の前に、今回の関数で求める事が出来る超幾何分布の確率というものについておさらいをしておきましょう。
超幾何分布は例えば、100枚のくじの中に当たりが10枚ある中で5枚取り出した時に、当たりが2枚入っている確率といった感じです。
以前にもこういった確率を求める時に、二項分布の確率というのをやりました。二項分布と超幾何分布の違いはベルヌーイ試行かどうかという所があります。ベルヌーイ試行は1回目の試行結果が2回目の試行結果の確率に影響しないという物になります。例えばサイコロとかは、どの目が出るのも1/6の確率ですね。この確率は何度やっても変わりません。いわゆる同様に確からしいと言われるものですね。
これに対し、くじは100枚ある中から1枚取り出すと残りは99枚になります。2回目は99枚の中からくじを引く事になるので、確率が変わりますよね。これが超幾何分布になります。ちなみに取り出したくじを取り出した後にもどす時はベルヌーイ試行となり二項分布の確率で計算する事になるので違いに気を付けましょう。
実際に手動で計算すると大変ですがExcel関数で簡単に確率が出せます!
Excelの『HYPGEOM.DIST』と『HYPGEOMDIST』関数の異なる部分と使い方を知ろう!
Excelでは超幾何分布の確率を計算する時の関数が2つ存在していますね。『.(ドット)』が付いているパターンと付いてないパターンの名前の関数です。これまでのこの様な違いだけという事はありましたね。今回はどの様な違いがあるのでしょうか?関数それぞれの異なる部分と計算についてやってみましょう!
関数『HYPGEOM.DIST』と『HYPGEOMDIST』の異なる所はどこ?
それでは『HYPGEOM.DIST』関数の違う部分について確認をしましょう。といっても、今回の関数の違いは、関数名に『.』がつくかつかないかという所で、計算する内容に違いはありません。
『HYPGEOM.DIST』の方が『HYPGEOMDIST』よりも新しく出来た関数になります。今後Excelのバージョンアップに伴って、古い関数は使えなくなる可能性もありますので、新しいのと活用していく様にします。
エクセル関数の『HYPGEOM.DIST』と『HYPGEOMDIST』計算してみよう!
これらの関数を使う際には引数が必要になりますね。Excelで使うにはどのような形になるのかを押さえておきましょう!
関数式:『= HYPGEOM.DIST(標本の成功回数・標本数・母集団の成功数・母集団の大きさ・関数形式)』
関数式:『= HYPGEOMDIST(標本の成功回数・標本数・母集団の成功数・母集団の大きさ・関数形式)』
何やら引数が関数にはたくさん必要になりますね。
上で記載した、くじを引く時の100枚のくじの中に当たりが10枚ある中で5枚取り出した時に、当たりが2枚入っている確率に話に合わせてみると、
1つ目の引数部分が『2』、2つ目の引数として『5』、3つ目の引数が『10』、4つ目の引数は『100』という事になる訳ですね。
最後の関数形式については『TRUE』か『FALSE』を指定します。
『TRUE』の時には、指定した標本の成功回数以上になるになる確率を計算し、『FALSE』の時には指定した成功回数ぴったりになる確率が求められます。
Excelの関数で超幾何分布の計算の活用で求めてみよう!
活用例としてExcelを使ってくじの話で確率を計算してみましょう!『HYPGEOM.DIST』と『HYPGEOMDIST』のどちらを活用しても良いですが、新しい方を使うのを推奨しているので『HYPGEOM.DIST』で求めてみます。形式の違いによって、結果も変化しますので注意しましょう!
関数形式TRUEの場合
B列に『=( HYPGEOM.DIST (B1、B2、B3、B4、TRUE)』と記入をする訳ですね。
今回は、当たりくじが5回以上引ける確率という事になります。
関数形式FALSEの場合
B列に『=( HYPGEOM.DIST (B1、B2、B3、B4、FALSE)』と記入をする訳ですね。
今回は、当たりくじがぴったり5回引ける確率という事になる訳ですね。
ぴったりとなると確率は下がりますねぇ
Excelの【HYPGEOM.DIST】・【HYPGEOMDIST】関数による超幾何分布の確率を計算しよう|【まとめ】
Excel(エクセル)で超幾何分布の確率を計算する関数の『HYPGEOM.DIST』と『HYPGEOMDIST』という二つで、どの様に活用していくのか、関数の引数や計算内容について紹介しました。分布に関わる計算式はたくさんあります。二項分布、指数分布、超幾何分布など様々ですね。どの時に何の分布になるのかを理解しておきましょう。
関数としてはExcelのバージョンアップに伴って新しくなったものも多くあります。この様に結果は同じでも名前が若干違うという物に関しては、Excelからなくなる可能性もある古い方の関数は、あまり使わないようにしておいた方がいいですね。
関数は分析などで使える物がありますのでExcelを使いこなして行ける様に覚えていきましょう!