統計分析でよく使われるシャピロ・ウィルク検定(Shapiro-Wilk検定)は、データが正規分布に従っているかどうかを調べるための代表的な正規性検定です。しかし、分析ソフトの出力結果に表示される「p値」が何を意味するのか分からず困る人も少なくありません。この記事では、シャピロ・ウィルク検定のp値の意味と結果の解釈方法をわかりやすく解説します。
シャピロ・ウィルク検定とは
シャピロ・ウィルク検定は、サンプルデータが正規分布から得られたと考えてよいかを判断するための統計手法です。
この検定では、まず「データは正規分布に従う」という仮説(帰無仮説)を立てます。
その上で、実際のデータが正規分布からどれくらい離れているかを数値化し、統計的に判断します。
p値とは何か
p値とは、「帰無仮説が正しいと仮定した場合に、今回のデータ以上に極端な結果が得られる確率」のことです。
シャピロ・ウィルク検定では、帰無仮説は「データは正規分布に従う」です。
つまりp値は、『もし本当に正規分布だったとして、今回のようなズレが偶然起こる確率』を表しています。
p値の見方
一般的には有意水準5%(0.05)を基準に判断します。
| p値 | 解釈 |
|---|---|
| p≧0.05 | 正規分布と矛盾しない |
| p<0.05 | 正規分布ではない可能性が高い |
例えばp値が0.27の場合、正規分布から得られたデータとして十分あり得るため、正規性を否定しません。
一方でp値が0.003の場合は、正規分布だったとするとそのようなデータは非常に起こりにくいため、正規性を否定します。
具体例で考えてみよう
あるテストの点数データに対してシャピロ・ウィルク検定を実施したとします。
結果がp=0.18だった場合、0.05より大きいため、「正規分布ではない」とは言えません。
逆にp=0.01だった場合は、0.05より小さいため、「正規分布に従う」という仮説を棄却します。
このとき重要なのは、「正規分布であることを証明した」のではなく、「正規分布ではないという十分な証拠が見つからなかった」と解釈することです。
よくある誤解
p値は「データが正規分布である確率」ではありません。
例えばp=0.80だからといって、「80%の確率で正規分布である」という意味ではないのです。
あくまで帰無仮説を前提として計算された確率であり、統計学ではその点を区別して考えます。
またサンプル数が非常に多い場合は、わずかなズレでもp値が小さくなることがあります。
なぜ正規性を調べるのか
t検定や分散分析など、多くの統計手法はデータが正規分布に近いことを前提としています。
そのため分析を行う前にシャピロ・ウィルク検定を実施し、正規性を確認することがあります。
もし正規性が認められない場合は、ノンパラメトリック検定など別の分析手法を検討します。
まとめ
シャピロ・ウィルク検定のp値は、「データが正規分布に従うと仮定したときに、今回の結果以上のズレが偶然起こる確率」を表しています。
一般的にはp値が0.05以上なら正規性を否定せず、0.05未満なら正規性を否定します。
ただしp値は「正規分布である確率」ではないため、その意味を正しく理解した上で結果を解釈することが大切です。


コメント