箱ひげ図
箱ひげ図(Box Plot)は、データセットの統計的な特性を視覚的に表現するためのグラフです。箱ひげ図は、データの中央傾向、分布、外れ値などの情報を提供するために使用されます。以下は、箱ひげ図の主要な要素とその解釈方法です:
-
箱(Box): 箱はデータの第1四分位数(Q1)から第3四分位数(Q3)までの範囲を表します。箱の上部(Q3)と下部(Q1)が箱の上下端を示し、箱の中央の線は中央値(Q2)を表します。箱の高さはデータの四分位範囲(IQR, Interquartile Range)を示し、IQRはデータの25%から75%までの範囲を表します。
-
ひげ(Whiskers): 箱ひげ図には、箱から外側に伸びる線(ひげ)が含まれています。ひげの長さはデータセット内のデータポイントの範囲を示し、通常は最小値から最大値までの範囲を表します。ただし、外れ値(異常値)が存在する場合、ひげは外れ値の範囲まで伸びず、外れ値を示す小さな点やマークで示されます。
-
外れ値(Outliers): 箱ひげ図に表示される外れ値は、データセット内で他のデータポイントから大きく外れた値を示します。外れ値は、データの分布の異常や特異性を示す重要な情報です。
箱ひげ図は以下のような情報を提供します:
- データの中央傾向:箱の中央の線(箱の中央)は中央値を表し、データの中央傾向を示します。
- データの分布:箱の高さ(IQR)はデータの分布の幅を示し、箱の上下端はデータの範囲を表します。
- 外れ値の検出:外れ値は、データセット内の異常値を示すために使用され、データの一般的な特性から外れた値を示します。
箱ひげ図は、統計的データの要約、異常値の識別、異なるデータセットの比較など、データ分析の多くの側面で役立ちます。データの中央傾向と分布を理解し、データの特性を視覚的に比較するのに便利なツールです。

ディスカッション
コメント一覧
まだ、コメントがありません