A、B、Cの具体例をあげてみて

具体例として、以下のような特徴量を考えてみます:

  • 特徴量A:身長(cm)
  • 特徴量B:体重(kg)
  • 特徴量C:体重(ポンド)

これらの特徴量はすべて人の体型に関連する情報を表していますが、特に特徴量Bと特徴量Cは同じ情報を異なる単位で表現しています。つまり、特徴量Bと特徴量Cはほぼ同じ情報を提供していると言えます。

例えば、身長が高い人は体重も一般的に重い傾向がありますが、体重の単位がキログラムとポンドで異なるため、特徴量Bと特徴量Cの相関関係が高いと考えられます。この場合、特徴量Bと特徴量Cは似たような情報を持っており、モデルにとっては冗長な情報となります。

未分類

Posted by ぼっち