正規化つかわないで、標準化使っとけばいいんじゃないの?

一般的に、特徴量のスケーリングにおいて、標準化が正規化よりも広く使用される傾向があります。その理由はいくつかあります。

  1. 外れ値の影響を受けにくい:

    • 標準化は平均と標準偏差を使用するため、外れ値の影響を受けにくい特性があります。一方、正規化は最小値と最大値を使用するため、外れ値がある場合には最小-最大スケーリングでは適切な結果が得られないことがあります。
  2. 平均が0、標準偏差が1になるため、比較が容易:

    • 標準化を行うことで、特徴量の平均が0、標準偏差が1になります。このため、特徴量間の比較が容易になります。一方、正規化を行った場合、各特徴量の値が0から1の範囲に収まりますが、それぞれの特徴量の平均や標準偏差が揃わないため、比較が難しくなることがあります。
  3. 正規分布を仮定していない:

    • 標準化は特定の分布を仮定していません。そのため、特徴量が正規分布に従っていなくても使用することができます。一方、正規化は最小値と最大値に基づいているため、データが一様分布でない場合には適切な結果が得られないことがあります。

したがって、一般的には標準化が正規化よりも広く使用されますが、データや特定のモデルによっては、正規化が適切な場合もあります。特に、特定のデータセットやモデルに適したスケーリング手法を選択することが重要です。

未分類

Posted by ぼっち