なぜonehotエンコーディングっていうの?

“One-hot encoding"という用語は、エンコードされたデータの中で、各カテゴリ変数が1つの"hot"な値(1)を持ち、その他の値がすべて"cold"な値(0)を持つことを指します。

この用語は、エンコードされたデータの表現方法が、各カテゴリ変数が単一の1で表されることに由来しています。つまり、1つのカテゴリ変数のみが"hot"な値(1)を持ち、その他の変数はすべて"cold"な値(0)を持ちます。

例えば、3つのカテゴリがある場合、次のようなエンコーディングが行われます。

  • カテゴリA: [1, 0, 0]
  • カテゴリB: [0, 1, 0]
  • カテゴリC: [0, 0, 1]

このようにして、各カテゴリ変数が1つの1を持ち、その他の変数が0を持つベクトル表現が生成されます。この方法は、カテゴリ変数を数値データに変換する際に使用され、機械学習アルゴリズムなどの数値データを処理するモデルに適した形式にデータを変換します。

未分類

Posted by ぼっち