target_encoderの使い方

2024年6月8日

category_encodersライブラリのTargetEncoderを使用して、カテゴリ変数のエンコーディングを行う方法を説明します。

まず、TargetEncoderをインポートします。

python
import category_encoders as ce

次に、ターゲットエンコーダーのインスタンスを作成します。

python
target_encoder = ce.TargetEncoder()

その後、fit_transformメソッドを使用して、カテゴリ変数をエンコードします。このメソッドは、エンコーディングされたデータを返します。

python
X_encoded = target_encoder.fit_transform(X, y)

ここで、Xはカテゴリ変数を含む特徴量のデータフレームであり、yは対応するターゲット変数（クラスラベル）です。fit_transformメソッドは、カテゴリ変数をエンコードし、エンコードされた特徴量を返します。

また、fit_transformメソッドを使用して訓練データでエンコーディングを行うときは、テストデータに適用する際に同じエンコーダーを使用して変換することが重要です。そのため、テストデータで新たにエンコーダーを作成するのではなく、既存のエンコーダーを使用して変換することが推奨されます。

python
X_test_encoded = target_encoder.transform(X_test)

こうすることで、訓練データとテストデータの間で同じエンコーディングが適用されます。

これが基本的なターゲットエンコーダーの使い方です。

Posted by ぼっち