Excelで相関係数を求める際に、CORREL関数とPEARSON関数のどちらを使うべきか迷う人は少なくありません。どちらも2つのデータ系列の相関関係を調べるための関数ですが、実は現在のExcelでは計算結果に違いはほとんどありません。この記事では、CORREL関数とPEARSON関数の意味や違い、使い分けの考え方をわかりやすく解説します。
CORREL関数とPEARSON関数とは
CORREL関数は、2組の数値データから相関係数を計算するExcel関数です。
一方、PEARSON関数も同様にピアソンの積率相関係数(Pearson Product-Moment Correlation Coefficient)を計算する関数です。
どちらも結果として求められるのは、-1から1の範囲を取る相関係数です。
| 関数名 | 目的 | 返される値 |
|---|---|---|
| CORREL | 相関係数を求める | ピアソンの積率相関係数 |
| PEARSON | 相関係数を求める | ピアソンの積率相関係数 |
実は現在のExcelではほぼ同じ結果になる
現行のExcelでは、CORREL関数もPEARSON関数も基本的に同じ計算方法を採用しています。
そのため、同じデータ範囲を指定した場合は同じ相関係数が返されます。
つまり、統計的な意味での使い分けはほとんど存在しません。
例えば次のようなデータがあるとします。
X:10,20,30,40,50
Y:12,18,35,42,55
この場合、=CORREL(A1:A5,B1:B5)と=PEARSON(A1:A5,B1:B5)は同じ値を返します。
なぜ2つの関数が存在するのか
PEARSON関数は統計学の「ピアソンの積率相関係数」を明示的に計算するための関数として古くから用意されていました。
その後、より直感的な名称としてCORREL関数が導入されました。
Excelの利用者の中には統計学の専門家だけでなく一般ユーザーも多いため、「Correlation(相関)」という名称のほうが分かりやすいという理由があります。
現在では両者は実質的に互換性を持つ関数として扱われています。
実務ではどちらを使うべきか
一般的なデータ分析やレポート作成ではCORREL関数を使う人が多くなっています。
理由は関数名から用途が直感的に分かりやすいためです。
- CORREL:相関分析を行うと分かりやすい
- PEARSON:統計学的な名称を重視したい場合に便利
研究論文や統計教育の場面ではPEARSON関数が登場することもありますが、業務用途ではCORREL関数だけ覚えておいても困ることはほとんどありません。
ピアソンの積率相関係数とは何か
ピアソンの積率相関係数とは、2つの変数がどれだけ直線的な関係を持っているかを表す指標です。
相関係数の値は次のように解釈されることが一般的です。
| 相関係数 | 解釈の目安 |
|---|---|
| 1に近い | 強い正の相関 |
| 0付近 | ほぼ相関なし |
| -1に近い | 強い負の相関 |
例えば勉強時間とテストの点数に強い正の相関があれば、勉強時間が増えるほど点数も高くなる傾向があると解釈できます。
まとめ
CORREL関数とPEARSON関数は、どちらもピアソンの積率相関係数を求めるExcel関数です。
現在のExcelでは計算結果に実質的な違いはなく、同じデータを入力すれば同じ相関係数が得られます。
一般的には用途が分かりやすいCORREL関数がよく利用されますが、統計学の文脈ではPEARSON関数も広く使われています。どちらを選んでも分析結果は基本的に変わらないため、好みや用途に応じて使い分けるとよいでしょう。


コメント