トウモロコシの種子の色が黄色:白色=3:1で遺伝するというメンデルの法則に基づいた適合度検定を行う問題です。観察されたデータを元に、適合度検定を使ってメンデルの予測とどれだけ一致しているかを確認します。この記事では、χ2統計量の計算方法を解説します。
適合度検定とは?
適合度検定は、観察されたデータが期待される理論的な比率にどれだけ一致しているかを検定するために用いられます。χ2(カイ二乗)検定は、この検定の中でも広く使われる方法の一つです。χ2統計量は、観察データと期待データの差を2乗し、期待値で割った値をすべてのカテゴリについて合計したものです。
今回の問題では、黄色と白色の種子が3:1の比率で分布することが予測されており、この予測に観察データがどれほど適合しているかを調べます。
観察データと期待データ
観察データは、黄色の種子が306個、白色の種子が94個です。トウモロコシの種子の色が黄色:白色=3:1の比率で生じる場合、期待される黄色と白色の種子の比率は、次のように計算できます。
期待される黄色の種子の数は、(400個 * 3/4) = 300個、期待される白色の種子の数は、(400個 * 1/4) = 100個です。
χ2統計量の計算方法
χ2統計量は次の式で計算されます。
χ2 = Σ [(O – E)² / E]
ここで、Oは観察された数、Eは期待される数です。
黄色の種子について。
χ2 = (306 – 300)² / 300 = 6² / 300 = 36 / 300 = 0.12
白色の種子について。
χ2 = (94 – 100)² / 100 = (-6)² / 100 = 36 / 100 = 0.36
これらを合計すると、χ2統計量は次のようになります。
χ2 = 0.12 + 0.36 = 0.48
χ2統計量の解釈
χ2統計量が計算できたら、次に自由度と有意水準を設定して、適合度検定を行います。自由度は、カテゴリーの数(ここでは2つ:黄色と白色)から1を引いた値、つまり1です。
χ2の分布を使って、有意水準(例えば5%)に対してχ2統計量がその範囲内に収まっているかを確認します。この場合、χ2統計量0.48は、自由度1での有意水準5%のカイ二乗分布表で見ると、期待される範囲内に収まります。
まとめ
今回の問題では、トウモロコシの種子の色の分布がメンデルの予測通りかを適合度検定を使って調べました。χ2統計量を計算することで、観察データが予測とどれだけ一致しているかを確認することができました。計算結果が有意水準内に収まっていれば、予測通りの分布が見られると結論できます。
コメント