Excel(エクセル)にはたくさんの関数があります。データを集計し統計的に分析する統計関数の中から、今回はVAR.P(バリアンス・ピー)関数を紹介します。
VAR.P関数は分散を扱う関数ですが、使い方について確認していきましょう。
ExcelにはVAR.P関数関数とVARP関数がありますがどちらも「バリアンス・ピー関数」と読み、意味合いは同じになります。
ピリオドなしのVARP関数は以前のExcelのバージョンから使用できていたものです。
今後使用する際はピリオドありのVAR.P関数を使うのが良さそうです。
以下の記事ではVAR.P関数と記載します。
目次
VAR.P(バリアンス・ピー)関数で求められる「分散」とは?
VAR.P関数を使用すると分散が求められます。
分散とは、数値データのばらつき具合を表す指標で、データのばらつきが大きいと分散は大きくなり、ばらつきが小さいと分散は小さくなります。
数値データを分析する際には平均値を求めることも多いですが、分散を求めることで平均値では得られない知見を得ることができます。
例えば、3日間の売り上げが100円、200円、300円だったとして平均は200円となりますが、別の3日間の売り上げが190円、200円、210円だとしてこちらも平均は200円となります。
平均が同じでも、期間によってはデータのばらつき具合が異なるということになりますね。
分散を求めて、どのくらいばらつくのか?なぜばらつくのか?という分析を観点に加えることができます。
分散の計算方法は?
分散の計算は「平均値から各データの差の2乗を全て足した値」の平均値となります。…難しそうですね。
大丈夫です。Excelの関数を使うとすぐ求めることができます。
VAR.S関数との使い分けは?母集団データを扱う際はVAR.P関数。
関数を使う前に、データが母集団データか標本データかを確認しましょう。
母集団データとは、一連のデータが分析対象の全件数を含むデータのことで、例えば「クラス全員のテストの点数」などは母集団データと捉えることができます。
標本データはサンプリングともいい、母集団データから抽出した1部分のデータということになります。例えば「街頭アンケートでランダムに調べた商品の満足度」などは標本データになります。
商品の購入者全てにアンケート調査をしたわけではないと想定できるからです。
ちょっと応用的な話をすると、ややこしいことにデータの中には母集団データとも標本データとも捉えることができるものがあります。
たとえば「クラス全員のテストの点数」を、クラス内の成績のみを観点に分析したければ母集団データと捉えます。
少し変ですが「Aクラスの点数を元に全クラスの点数を推測する」というようなシチュエーションでは、Aクラスの点数は標本データということになります。
要はどこに観点を持っていくかということで使い分けることになります。
そして、母集団データとして扱う場合はVAR.P(バリアンス・ピー)関数、
標本データとして扱う場合はVAR.S(バリアンス・エス)関数を使うということになるのです。
VAR.P(バリアンス・ピー)関数の使い方
今回は母集団を元に分散を求めるVAR.P(バリアンス・ピー)関数を使ってみます。
下記のように、テストの点数を全員集めた表を例に計算してみます。
VAR.P関数の書式は下記の通りです。
VAR.P(数値1,数値2,…)
VAR.P関数の引数には、分散を求める一連のデータを参照します。
今回であればB2からB10までをとります。
このように分散を求めることができました。
ちなみに、以前のExcelのバージョンから使用されていたVARP関数を試しに用いても同じような結果になります。
Excelで母集団データから分散を求めるVAR.P関数、VARP関数(バリアンス・ピー)まとめ
Excelにある統計関数の種類である、VAR.P関数の書き方と使い方について紹介しました。
分散を求める関数ということがわかりました。データの種類が母集団データか標本データかというところでVAR.S関数との使い分けが必要なところは注意が必要ですね。