統計学でよく使われる中央値ですが、階級を含む場合に計算方法が少し異なることがあります。この記事では、特に階級を含むデータでの中央値の求め方を具体例を交えて説明します。特に、課題で出てきたデータを例に、友達が求めた25.5という値について詳しく解説します。
中央値の基礎
中央値は、データを小さい順に並べたときに中央に位置する値です。データの個数が奇数の場合、中央の値がそのまま中央値となりますが、偶数の場合は中央の2つの値の平均が中央値となります。
ここで紹介するのは、階級を含むデータの場合の中央値の求め方です。階級がある場合は、中央値を含む階級の最小値とその階級の幅を使って計算を進めます。
階級を含む場合の中央値の計算方法
階級を含むデータにおける中央値の求め方は、次の式で表されます。
中央値 = 階級の最小値 + 階級の幅 × (データの個数の半分 – 累積度数) / 階級の度数
この式を使うためには、まずデータを階級ごとに分け、その累積度数と度数を計算する必要があります。
実際のデータを使った計算例
次に、与えられたデータで実際に中央値を求める方法を見ていきましょう。与えられたデータは次の通りです。
14 | 16 | 18 | 19 | 20 | 22 | 25 | 25 | 25 | 25 | 28 | 28 | 30 | 30 | 30 | 30 | 30 | 30 | 30 | 35 |
このデータの中央値を求めるために、まずはデータの個数が20であることがわかります。そのため、中央値は10番目と11番目の間に位置します。
具体的には、10番目の値が25、11番目の値が28です。この場合、中央値は25.5になります。これは、中央の2つの値の平均を取るためです。
25.5が中央値になる理由
中央値が25.5になる理由は、データの個数が偶数(20個)であり、中央に位置する値が2つ存在するからです。10番目と11番目の値が25と28であるため、その平均である25.5が中央値となります。
これは、式に従った計算結果としても確認できます。すなわち、データの個数が偶数のときは、中央の2つの値の平均が必ず中央値となります。
まとめ
本記事では、階級を含むデータでの中央値の求め方を解説しました。特に、データの個数が偶数の場合に中央値がどのように求められるのかを実例を交えて説明しました。25番目と28番目の値の平均である25.5が正しい中央値である理由が理解できたと思います。
コメント