ある国の血液型に関する確率変数Xkについて、標準偏差を0.01以下に保つために必要なサンプル数nを求める問題を解説します。この問題は、確率変数の標準偏差を理解し、実際に求める方法を学ぶ良い機会です。
問題の概要
問題では、ある国の人々の血液型が10人に3人の割合でO型であることがわかっています。この国からn人を無作為に抽出し、k番目に抽出された人がO型ならば1、それ以外の血液型なら0という確率変数Xkを設定します。
ここで、x̅(n人のサンプル平均)の標準偏差が0.01以下になるようにするためには、何人以上のサンプルを抽出すればよいかを求めます。
確率変数Xkの性質と標準偏差の求め方
確率変数Xkは、1または0を取る二項分布に従います。O型の人が選ばれる確率は3/10、O型以外の人が選ばれる確率は7/10です。このような場合、Xkの平均値E[Xk]と分散Var[Xk]を求めることができます。
Xkの平均値E[Xk]は、O型が選ばれる確率である3/10です。次に、Xkの分散Var[Xk]は、二項分布の性質を利用して次のように求められます。
Var[Xk] = p(1 – p) = (3/10)(7/10) = 21/100
これがXkの分散です。
標準偏差を求めるためのサンプル平均の標準偏差
n人を抽出した場合のサンプル平均x̅の標準偏差は、標準誤差と呼ばれ、次のように求められます。
標準誤差 = √(Var[Xk] / n) = √(21/100n)
この標準誤差を0.01以下にするために、nの値を求めます。
標準偏差を0.01以下にするためのnの計算
標準誤差が0.01以下になるためには、次の不等式を解きます。
√(21/100n) ≤ 0.01
両辺を2乗すると。
21/100n ≤ 0.0001
n ≥ 21 / (100 * 0.0001) = 2100
したがって、nは2100人以上である必要があります。
まとめ:標準偏差を0.01以下にするためのサンプル数n
今回の問題を解くために、標準偏差を0.01以下にするためには、サンプル数nが2100人以上である必要があることがわかりました。確率変数Xkの標準偏差を求めるためには、二項分布の性質を理解し、標準誤差を計算することが重要です。実際の問題でも、このような手法を使って確率や統計に関する質問を解決することができます。


コメント