相関係数rは、2つの変数の関係の強さと方向を示す統計量です。その値は、-1から1の範囲に収まりますが、なぜそのような範囲になるのかを理解することは、統計学を学ぶうえで重要です。この記事では、相関係数がなぜこの範囲に制約されるのか、その理由を説明します。
相関係数とは
相関係数rは、2つの変数xとyの間にどのような線形関係があるかを示す指標です。rの値は、-1から1までの範囲を取ります。r = 1の場合は完全な正の相関、r = -1の場合は完全な負の相関、r = 0の場合は相関がないことを意味します。
相関係数rの計算方法
相関係数rは次の式で計算されます。
r = Σ[(xᵢ – x̄)(yᵢ – ȳ)] / √Σ(xᵢ – x̄)² Σ(yᵢ – ȳ)²
ここで、xᵢ, yᵢはそれぞれのデータポイント、x̄, ȳはx, yの平均値です。この式からわかるように、相関係数はxとyの各データ点の偏差がどれだけ一致するかに依存しています。
なぜ相関係数rは-1から1に制限されるのか
相関係数rが-1から1の範囲に収まる理由は、数学的に計算した結果、偏差の積の和が平方根の積によって制約されるからです。具体的には、分子にあたる偏差の積の和は、分母の平方根に比べて大きくなりようがないため、rは-1から1の範囲に収束します。
また、rが1または-1になるのは、xとyが完全に直線的な関係を持っている場合に限ります。これ以上強い相関は存在しません。したがって、相関係数は-1と1の間で収束するという結果になります。
まとめ
相関係数rが-1≦r≦1の範囲に収束する理由は、数学的な計算結果と、xとyのデータの偏差の積と平方根の関係にあります。この範囲内でのみ相関が正確に表現されるため、相関係数は-1から1の間に制約されています。
コメント