パーセンタイル

パーセンタイル(Percentile)は、データの分布を表現し、データセット内の特定の位置にあるデータ値を示すための統計的な概念です。パーセンタイルは、データを等間隔の100個の区間に分割し、各区間に含まれるデータの割合を表す指標です。一般的に、0から100の範囲で表現され、特定のパーセンタイルはその割合を示します。

以下は、パーセンタイルの主な例です:

  1. 第25パーセンタイル(25th Percentile)または第1四分位数(First Quartile):データの中央値よりも小さい値の中で最も小さい値を示します。データをソートした場合、最も下位の25%に位置する値です。

  2. 第50パーセンタイル(50th Percentile)または中央値(Median):データセットをソートしたときに中央に位置する値で、データの中央に分ける値です。

  3. 第75パーセンタイル(75th Percentile)または第3四分位数(Third Quartile):データの中央値よりも大きい値の中で最も小さい値を示します。データをソートした場合、最も上位の25%に位置する値です。

これらのパーセンタイルは、データセットの中央傾向や分布を理解するのに役立ちます。例えば、第25パーセンタイルと第75パーセンタイルを使用して、データの中央50%の範囲(四分位範囲、Interquartile Range)を計算することで、データの散らばりや分散を評価することができます。

パーセンタイルは、データの要約統計情報の一部として使用され、ボックスプロットなどの視覚化方法でも利用されます。また、パーセンタイルを使用して外れ値の検出やデータの分布の比較を行うこともあります。