One-hotエンコーディング

One-hotエンコーディング(ワンホットエンコーディング)は、カテゴリカル変数を数値データに変換するための手法の一つです。カテゴリカル変数は、数値で表現されていないカテゴリを持つ変数であり、例えば色(赤、青、緑)、地域(東京、大阪、札幌)などがあります。

One-hotエンコーディングでは、各カテゴリに対して新しいバイナリ変数(ダミー変数)を作成し、該当するカテゴリの場合に1を、それ以外の場合に0を割り当てます。これにより、カテゴリカル変数が数値ベクトルに変換され、機械学習モデルに適用できるようになります。

例えば、カテゴリカル変数が「色」であり、赤、青、緑の3つのカテゴリがある場合、One-hotエンコーディングでは以下のように変換されます:

  • 赤: [1, 0, 0]
  • 青: [0, 1, 0]
  • 緑: [0, 0, 1]

このようにして、カテゴリカル変数が数値ベクトルに変換され、機械学習モデルに入力することができます。One-hotエンコーディングは、多クラス分類や回帰などのタスクで広く使用されています。

未分類

Posted by ぼっち