歪度(わいど)

歪度(わいど、Skewness)は、統計学で使用される用語で、データセットの分布が左右対称でない程度を示す指標です。歪度は、分布の非対称性を定量化し、分布が左に寄っているか右に寄っているかを評価するのに役立ちます。歪度は、データのヒストグラムや分布グラフを解釈する際に有用です。

歪度の主な特徴は次の通りです:

  1. 正の歪度(Positive Skewness):分布が右に寄っている場合、歪度は正の値を持ちます。つまり、データセットの右側の尾が長く、左側の尾が短い分布です。これは、データセット内に大きな値や外れ値が含まれている可能性が高いことを示すことがあります。正の歪度の例には、所得分布などがあります。

  2. 負の歪度(Negative Skewness):分布が左に寄っている場合、歪度は負の値を持ちます。つまり、データセットの左側の尾が長く、右側の尾が短い分布です。これは、データセット内に小さな値や外れ値が含まれている可能性が高いことを示すことがあります。負の歪度の例には、テストの点数分布などがあります。

  3. 歪度がゼロ(Zero Skewness):分布が左右対称の場合、歪度はゼロになります。つまり、左右の尾がほぼ同じ長さで、分布は対称です。正規分布(正規分布)は歪度がゼロの例です。

歪度は通常、以下の数式を用いて計算されます:

歪度 = (3 * (平均 – 中央値)) / 標準偏差

この数式は、データの平均、中央値、および標準偏差を使用して歪度を計算します。歪度の値が正の場合、分布は右に歪んでいます。負の場合、分布は左に歪んでいます。歪度の値がゼロに近い場合、分布は対称です。

歪度は、データの特性を理解し、適切な統計的手法を選択する際に役立ちます。