フィッシャーの正確確率検定の理解と計算方法:疑問点の解決

数学

フィッシャーの正確確率検定は、統計学においてよく使われる手法で、特に小さなサンプルサイズの場合に有効です。この検定は、2×2の分割表(クロス集計表)に基づいて、有意差があるかどうかを判定するために使用されます。この記事では、フィッシャーの正確確率検定についての基本的な理解を深め、よくある疑問点を解決します。

フィッシャーの正確確率検定の基本

フィッシャーの正確確率検定は、帰無仮説が「グループ間に差はない」とするもので、統計的な有意性を評価するために使います。特にサンプルサイズが小さい場合に有効で、カイ二乗検定の代わりに使用されます。例えば、A群とB群の2つのグループにおける薬の効果を比較する場合、次のような2×2のクロス集計表を使います。

効果あり 効果なし 計
A a b c
B d e f
計 g h n

このように表にまとめられたデータを基に、フィッシャーの正確確率検定を行います。

フィッシャーの正確確率検定の計算方法

まず、与えられたデータを基にして、確率分布を求めます。この確率分布を用いて、帰無仮説が真である場合に得られるすべてのパターンを計算します。次に、実際の観測結果がどのくらい稀な結果であるかを計算します。具体的な計算式として、次のように表されます。

X={x | 0≦x≦c,あるz(0≦z≦f)でx+z=g}

ここで、a':=Max Xは、最も高い確率を持つxの値です。この値に基づいて、次の不等式を求めます。

Σ[a≦x≦a'] cCx • fC(g-x) / nCg < 0.05

この計算を行うことで、有意水準5%でA群の方がB群より薬が効きやすいかどうかが判定できます。

分母がnCgである理由

質問にあった「分母がnCgの理由」についてですが、これは表全体の得られるすべてのパターンを考慮しているためです。nCgは、与えられた条件下でのすべての組み合わせを表しており、この計算がなければ、異なるサンプルの確率が比較できません。

具体的には、g,h,nは固定されており、そこから得られる組み合わせの総数を計算することで、実際に観測されたデータがどれくらい異常であるかを評価します。この計算によって、帰無仮説の下でのデータの確率分布を比較することができるのです。

B群を基準にした計算方法

B群を基準にした場合も、同様に計算ができます。c,d,e,f,nを固定し、a,b,g,hを動かすことで得られる表のパターンを考慮する方法です。このように、検定の目的やデータの構造に応じて、基準を変えることで異なる視点からの評価が可能になります。

まとめ

フィッシャーの正確確率検定は、特にサンプルサイズが小さい場合に有効な方法です。質問であったように、分母がnCgとなる理由は、すべてのパターンを考慮するためです。検定を正確に行うためには、各ステップの計算方法を理解し、適切に仮説検定を進めることが大切です。

コメント

タイトルとURLをコピーしました