階級幅は、等間隔なの?

度数分布表における階級幅は、通常、等間隔に設定します。等間隔の階級幅を使用する理由は、データの分布をわかりやすくし、比較を容易にするためです。以下に、等間隔の階級幅の設定手順を再度簡単にまとめます。

  1. データの範囲を求める:

    • データの最大値と最小値を求め、その差を計算します。
    • 例:データの最大値が95、最小値が25の場合、範囲は95 – 25 = 70となります。
  2. 階級の数を決める:

    • データの個数に基づいて、階級の数(クラス数)を決めます。ストージェスの公式を使用することが多いです。
    • 例:データの個数が50の場合、$k = 1 + 3.322 log_{10}(50) 6.64$。この場合、7つの階級に分けます。
  3. 階級幅を求める:

    • データの範囲を階級の数で割って階級幅を決定します。
    • 例:範囲が70で、階級の数が7の場合、階級幅は70 / 7 = 10です。
  4. 階級を設定する:

    • 階級幅が決まったら、最小値以下の適切な開始点を選び、等間隔で階級を設定します。
    • 例:開始点を20、階級幅を10とした場合、次のように設定します。
      • 20 – 30
      • 30 – 40
      • 40 – 50
      • 50 – 60
      • 60 – 70
      • 70 – 80
      • 80 – 90
      • 90 – 100

等間隔の階級幅を使用することで、データの比較が簡単になり、視覚的にもわかりやすいグラフやヒストグラムを作成することができます。

ただし、場合によっては等間隔でない階級幅を使用することもあります。例えば、データに極端な偏りがある場合や特定の範囲に特別な興味がある場合などです。しかし、基本的には等間隔の階級幅を使用することが推奨されます。

未分類

Posted by ぼっち