相関係数0.95でも安心できない?気温上昇と人口増減のデータ分析で注意したいポイント

気象、天気

「気温上昇率が高い都市ほど人口も増えている」というデータを見て、強い関係があるように感じる人は多いかもしれません。実際、相関係数が0.95〜0.98という数値は、統計学では“非常に強い正の相関”として扱われます。

しかし、相関係数が高いからといって、必ずしも「気温上昇が人口増加を引き起こしている」とは言えません。

この記事では、気温上昇率と人口増減率の相関をどう読むべきか、統計学的な視点からわかりやすく整理していきます。

そもそも相関係数とは何か

相関係数とは、2つのデータの「関係の強さ」を表す数値です。

相関係数 意味
1に近い 強い正の相関
0付近 ほぼ関係なし
-1に近い 強い負の相関

例えば、「身長が高い人ほど体重も重い」という関係は、正の相関の典型例です。

そのため、0.95〜0.98という数値だけを見ると、かなり強い関係がありそうに見えます。

ただし「相関」と「因果」は別物

ここで最も重要なのが、「相関がある」と「原因である」は違う、という点です。

たとえば都市部では、

  • 人口が多い
  • 建物や道路が密集している
  • エアコンや車の排熱が多い
  • アスファルトが熱をためやすい

という特徴があります。

この現象はヒートアイランド現象と呼ばれ、都市の気温上昇に大きく関係しています。

つまり、「人口が増えて都市化した結果として気温が上がった」可能性もあるわけです。

逆に、「気温が上がったから人口が増えた」とは限りません。

サンプル数が少ないと相関係数は不安定になりやすい

提示されている都市は、

  • 寿都
  • 飯田
  • 福岡市
  • さいたま市

の4地点です。

統計学では、サンプル数が少ない場合、相関係数は非常に大きくも小さくもなりやすい傾向があります。

極端な話、4点だけなら偶然きれいな直線に並ぶこともあります。

そのため、本当に強い関係があるかを判断するには、

  • もっと多くの都市を使う
  • 同じ期間で比較する
  • 人口規模を揃える
  • 都市化率など他の変数も考慮する

といった工夫が必要になります。

比較条件が統一されているかも重要

提示されたデータを見ると、

  • 100年間の気温変化
  • 130年間の気温変化
  • 人口率の基準年

などが完全には統一されていないように見えます。

統計分析では、「比較条件を揃える」ことがとても重要です。

例えば、ある都市だけ130年、別の都市は100年という比較だと、単純な相関計算ではズレが生じる可能性があります。

都市化が共通要因になっている可能性

この種の分析でよく出てくるのが、「第三の要因」です。

例えば、

  • 人口増加
  • 都市開発
  • 交通量増加
  • 建物密集

が同時に起きると、結果として気温も上昇しやすくなります。

つまり、

都市化 → 人口増加 と 気温上昇

という構造かもしれません。

この場合、「気温上昇」と「人口増加」は直接の原因と結果ではなく、同じ原因から生じた“見かけ上の相関”になります。

統計では「データの解釈」が最も難しい

統計学では、計算そのものよりも「その数値をどう解釈するか」が非常に重要です。

相関係数0.95という数値自体は興味深いですが、

  • データ数が十分か
  • 条件が統一されているか
  • 他の要因を除外できているか
  • 因果関係を示しているか

を慎重に確認する必要があります。

これは大学レベルの統計学や社会調査でも非常に重視される考え方です。

まとめ

気温上昇率と人口増減率の間に高い相関係数が出たとしても、それだけで「気温上昇が人口増加を引き起こしている」と結論づけることはできません。

特に今回のようなケースでは、

  • サンプル数の少なさ
  • 都市化という共通要因
  • 比較条件の違い
  • ヒートアイランド現象

などを考慮する必要があります。

統計で大切なのは「数字を見ること」だけではなく、「なぜその数字になったのか」を考えることです。

相関係数は便利な道具ですが、因果関係を断定する前には、データの背景まで丁寧に見る姿勢が重要と言えるでしょう。

コメント

タイトルとURLをコピーしました