Excelの統計関数にはデータの分析用の関数がたくさんありますね。今回はその中でカイ二乗分布に関する関係する『CHIDIST』『CHISQ.DIST』『CHISQ.DIST.RT』の3つについて紹介します。それぞれの関数の読み方は
『CHIDIST(カイ・ディストリビューション)』・『CHISQ.DIST(カイスクエアド・ディストリビューション)』・『CHISQ.DIST.RT(カイスクエアド・ディストリビューション・ライトテイルド)』となりますね。
これらの関数を使う事でデータの位置関係など分析出来る事がある訳ですね。
今回はカイ二乗分布が何なのか簡単に説明し、それぞれの関数の書き方について紹介します。
目次
用語をチェック!『カイ二乗分布』って何?
今回の統計の関数になっていて、カイ二乗分布に対して『確率密度関数』と『累積分布関数』を計算する物になります。
では『カイ二乗分布』って何でしょうか?
分布としては『自由度』の数値によって下の図の様な感じで変わるのがカイ二乗分布です。
『カイ二乗分布』は、【現象が偶然とは言えない事を考える】時に使われます。
例えば、赤と白の玉が合計10個入った箱の中から、『1個玉を取り出して色を確認して箱に戻す』という事を10回やったとします。この時の結果が『赤が1回、白が9回』だった時、箱に入っている玉の色の数は『赤白5個ずつ』と考えられるでしょうか?
感覚的には『白の方が多く入っている』という感じがしますが、『たまたま多く白が出て来ただけで、赤と白は同数入っている』と言われれば、その可能性は否定出来ないですね。でも『たまたま多く白が出て来たが、実際には赤が9個、白が1個、箱の中に入っている』というのはどうでしょうか?そういう可能性もあるかもしれませんが、『赤と白が同数入っている』という状態よりは考えにくいですよね。
では、偶然では考えにくいという事をどの様に表せばよいでしょうか?
今回の場合は、箱の中にどの様に玉が入っているのか実際に確認すればよいですが、統計では事象の結果から全体を推測する訳ですから、そうは行きません。
そこでその事象が偶然として起こる可能性がどのくらいの確率であるのかを考えます。その時に使うのが『カイ二乗分布』なんですね。これを使う事で理論値から期待値がどのくらい外れているのかが分かります。
因みに定義としては『平均0、分散1の正規分布の確率変数を二乗した数値を足し合わせた変数の分布』という事になっています。
カイ二乗分布の細かい計算式は、ここでは割愛しますので、どんな時に活用されているのかのイメージだけしておいてくださいね。
カイ二乗分布の関数『CHIDIST』と『CHISQ.DIST.RT』の書き方・使い方をチェック
ではまず初めに『CHIDIST(カイ・ディストリビューション)』と『CHISQ.DIST.RT(カイスクエアド・ディストリビューション・ライトテイルド)』の活用からチェックしていきます。
実はこの2つについてはどちらも同じ計算をする関数で、指定した数値が、指定した自由度のカイ二乗分布の中での右側累積分布関数を計算する事が出来ます。右側累積分布関数右から考えてどのくらいの位置にあるのかという事でしたね。
関数の書き方と引数はこうですね。
関数式:『=CHIDIST(数値、自由度)』
関数式:『=CHISQ.DIST.RT(数値、自由度)』
Excelのバージョンアップと共に新しく出来た関数が『CHISQ.DIST.RT』の方になります。
結果はどちらも同じになりますし、どちらの関数もまだ使えますが、新しい方を使う様に推奨されています。
カイ二乗分布の関数『CHIDIST』『CHISQ.DIST.RT』を実際に使ってみよう!
実際に計算をしてみましょう。数値と自由度を設定しておきます。
今回は『自由度2』のカイ二乗分布の中で『数値3』の右側累積分布関数を計算してみます。
CHIDIST関数の方かラやってみます。
計算式は『=CHIDIST(B1、B2)』になりますね。
関数を確定して結果を見てみましょう!
これが右側からの位置になります。
次にCHISQ.DIST.RTでもやってみます。
計算式は『=CHISQ.DIST.RT(B1、B2)』ですね。
関数を確定するとさっきと同じ結果になっている事が分かりますね。
カイ二乗分布の関数『CHISQ.DIST』の書き方・使い方をチェック
ではもう1つの『CHISQ.DIST(カイ・スクエアド・ディストリビューション)』関数についてやってみましょう。
これはカイ二乗分布の中で指定した数値の『確率密度関数』と『累積分布関数』が計算出来ます。
累積分布関数は、分布の左から考えてどのくらいの位置にあるかという事でしたね。
確率密度関数は、その数値が分布の中でどのくらいの割合を占めているのかの数値でしたね。
これらを計算する事が出来ます。計算式は次の通りですね。
関数式:『=CHISQ.DIST(数値、自由度、関数形式)』
関数形式では『TRUE』と『FALSE』のどちらかを指定します。
『TRUE』の場合は『累積分布関数』の計算、『FALSE』の場合は『確率密度関数』の計算になりますので間違わない様に気を付けてくださいね。
カイ二乗分布の関数『CHISQ.DIST』を実際に使ってみよう!
では実際に累積分布関数と確率密度関数を計算してみましょう。
さっきと同じ数値と自由度でやってみます。まずは累積分布関数を求めてみます。
計算式は『=CHISQ.DIST(B1、B2、TRUE)』ですね。
これが累積分布関数の結果になります。
右側累積分布関数の結果と合計すると1になるので合っていますね。
今度は確率密度関数を出してみましょう。
計算式は『=CHISQ.DIST B1、B2、FALSE)』になりますね。
これが全体のどのくらいの割合を占めているのかの数値になります。
Excelのカイ二乗分布の関数【CHIDIST】【CHISQ.DIST】【CHISQ.DIST.RT】の使い方|【まとめ】
今回は統計関数の中でカイ二乗分布の確率密度関数、累積分布関数、右側累積分布関数の計算が出来る『CHIDIST』『CHISQ.DIST』『CHISQ.DIST.RT』を紹介しました。
Excelのバージョンによって新しく出来た関数が『CHISQ.DIST』『CHISQ.DIST.RT』の2つになります。
これから使う時はこっちを使って行くのがよさそうですね。
そしてどの関数で何を求められるのかを忘れない様にしてくださいね。
右側累積分布関数の計算が出来るのが『CHIDIST』か『CHISQ.DIST.RT』ですね。
累積分布関数の計算は『CHISQ.DIST』で関数形式が『TRUE』、確率密度関数の時は『CHISQ.DIST』で関数形式が『FALSE』という事になります。
カイ二乗分布の関数にはこれらの逆関数もあります。それは別途紹介しますので、整理して覚えて行きましょう!