統計学でよく出てくる「共分散」と「標準偏差の積の平均」という言葉は、数字のばらつきや関係性を表す指標です。初めて聞くと難しく感じますが、具体例で考えると理解しやすくなります。この記事では、共分散の定義と標準偏差の積の平均の意味を高校数学レベルで解説します。
共分散とは何か
共分散は2つのデータの変動が一緒に大きくなるか、小さくなるかを表す指標です。値が正なら一緒に増減し、負なら逆の動きをします。
例えば、身長と体重のデータを考えたとき、身長が高い人ほど体重も重い傾向があれば共分散は正になります。
共分散の計算式と意味
共分散は次の式で表されます。
cov(X,Y) = Σ((X_i – μ_X)(Y_i – μ_Y)) / n
ここで X_i と Y_i は各データ、μ_X と μ_Y はそれぞれの平均値です。各データから平均値を引いたものを掛けて平均することで、2つの変数の関係性を数値で表しています。
標準偏差の積の平均とは
標準偏差はデータの散らばり具合を表す指標で、共分散を標準偏差で割ると「相関係数」と呼ばれる無次元の指標になります。
相関係数 r は次の式です。
r = cov(X,Y) / (σ_X * σ_Y)
ここで σ_X と σ_Y は X と Y の標準偏差です。分母に標準偏差の積を使うことで、単位やスケールの違いを吸収し、-1から1の範囲で関係性を表せます。
具体例で理解する
例として、あるクラスの数学と英語の点数を考えます。点数の平均と標準偏差を計算し、各生徒の得点から平均を引いた値を掛け合わせます。これを全員分平均すると共分散になります。さらに標準偏差で割ると、点数のばらつきの違いを調整した相関の強さがわかります。
まとめ
共分散は2つのデータの一緒に動く傾向を数値化したものです。標準偏差の積で割ることで、相関係数となり、スケールに依存せずに関係性を比較できます。理解のコツは、「平均からの差を掛けて、どれだけ一緒に動くかをみる」と考えることです。


コメント