統計学における分散の計算方法は、分布やサンプルサイズに依存するため、同じように見える式でも異なる結果が得られることがあります。特に、正規分布の近似に関する質問でよく見られるのが、分散の計算においてnで割るものと割らないものの違いです。この違いがどこから来るのかを詳しく解説します。
正規分布における分散の計算
標本正規分布(サンプルサイズがnの場合)の分散は、母集団の分散σ²をnで割ったものに相当します。この式は、標本平均が母集団平均に近づくにつれて、標本の分散が小さくなることを反映しています。具体的には、標本分散はσ² / nとして求められます。
二項分布における分散の計算
一方、二項分布における分散は、サンプルサイズnと成功確率pに基づいて次のように表されます。
分散 = np(1-p)
この場合、分散はサンプルサイズnで割るのではなく、成功確率pを使って計算されます。つまり、nはそのまま使います。
フィッシャーのZ変換と分散
フィッシャーのZ変換では、相関係数rを正規分布に変換する際に使用します。この変換後の分布における分散は、サンプルサイズに依存しますが、単純にnで割るわけではなく、変換のプロセスで導かれた別の数式を使って計算されます。
フィッシャーのZ変換は、相関の統計的有意性を検定するための手法であり、nで割るのではなく、異なる計算方法が適用されます。
なぜnで割るものと割らないものがあるのか?
正規分布、二項分布、フィッシャーのZ変換における分散の違いは、それぞれの統計量がどのように計算されるかに基づいています。正規分布では、標本の分散が母集団の分散に近づくため、nで割って標本の誤差を調整します。二項分布やフィッシャーのZ変換では、確率や相関係数が使われ、サンプルサイズに応じて異なる方法で調整されるため、nで割る必要はありません。
まとめ
統計学における分散の計算方法は、どの分布を使用するか、またその分布の特性によって異なります。正規分布ではnで割る理由がありますが、二項分布やフィッシャーのZ変換では異なる方法が適用されます。これらの違いを理解することで、より正確に統計を扱うことができるようになります。
コメント