pandasのdummieとかいうメソッドは、onehotエンコーディング?

2024年6月17日

はい、pandasget_dummies()メソッドは、カテゴリカルな特徴量をOne-Hotエンコーディングするために使用されます。このメソッドを使うと、カテゴリカルな特徴量を持つ列を、新しいダミー変数(バイナリ特徴量)に変換することができます。各カテゴリは新しいダミー変数として表現され、そのカテゴリに属する行では1が、そうでない行では0が入ります。

以下はget_dummies()メソッドの使い方の例です:

python
import pandas as pd

# カテゴリカルな特徴量を含むデータフレームの作成
data = {'color': ['red', 'blue', 'green', 'red', 'green']}
df = pd.DataFrame(data)

# One-Hotエンコーディングの実行
df_encoded = pd.get_dummies(df['color'])

print(df_encoded)

出力:

   blue  green  red
0     0      0    1
1     1      0    0
2     0      1    0
3     0      0    1
4     0      1    0

上記の例では、color列がget_dummies()メソッドを使用してOne-Hotエンコーディングされ、新しいダミー変数に変換されました。

未分類

Posted by ぼっち