複数のグループの平均値が分かっているとき、それらをまとめた全体の平均値を求めたい場面があります。このとき単純に平均値同士を足して2で割ってよいのかは、各グループの項目数によって決まります。この記事では、平均値の統合方法と注意点を具体例とともに解説します。
平均値同士を足して2で割ってよいケース
結論から言うと、平均値1と平均値2の元になっているデータ数(項目数)が同じであれば、平均値同士を足して2で割る方法で正しい全体平均を求められます。
例えば、10人の平均点が70点、別の10人の平均点が80点だった場合、全20人の平均点は次のようになります。
(70+80)÷2=75
両グループとも人数が同じなので、この計算で正しい結果になります。
なぜ項目数が同じなら単純平均でよいのか
平均値は「合計÷個数」で求められます。
1つ目のグループをn個、平均値をA、2つ目のグループをn個、平均値をBとすると、それぞれの合計はA×n、B×nです。
全体平均は次の式になります。
(A×n+B×n)÷(n+n)
これを整理すると、(A+B)÷2になります。
つまり項目数が同じであることが、平均値同士を単純に平均できる理由です。
項目数が異なる場合は注意が必要
一方で、項目数が異なる場合は単純に平均値同士を平均すると誤った結果になります。
例えば、5人の平均点が60点、15人の平均点が80点だったとします。
| グループ | 人数 | 平均点 |
|---|---|---|
| A | 5人 | 60点 |
| B | 15人 | 80点 |
単純平均すると70点になりますが、正しい計算は次の通りです。
(60×5+80×15)÷20=75点
人数の多いグループの影響を考慮する必要があります。
加重平均という考え方
項目数が異なる場合に使うのが「加重平均」です。
加重平均とは、それぞれの平均値にデータ数を掛けて重み付けした平均のことです。
一般式は次のようになります。
全体平均=(平均値1×項目数1+平均値2×項目数2)÷(項目数1+項目数2)
統計学やデータ分析では、この考え方が非常に重要です。
実生活での具体例
学校のテスト結果、商品の評価点、店舗ごとの売上平均などでは、グループごとの人数や件数が異なることがよくあります。
例えばレビュー評価で「5件の平均4.0」と「500件の平均4.5」がある場合、単純に4.25と考えるのは正確ではありません。
実際には件数の多い後者の影響が大きいため、全体平均は4.5に近い値になります。
まとめ
平均値1と平均値2の項目数が同じなら、平均値同士を足して2で割るだけで全体平均を求められます。
しかし、項目数が異なる場合は単純平均ではなく加重平均を使う必要があります。
平均値を統合する際は、まず元になったデータ数が同じかどうかを確認することが大切です。これを意識するだけで、統計やデータ分析の正確性が大きく向上します。


コメント