具体的なサンプルコードちょうだい

2024年6月8日

以下はPythonでのSMOTE（Synthetic Minority Over-sampling Technique）を使ったオーバーサンプリングのサンプルコードです。SMOTEはimbalanced-learnライブラリから利用できます。

python
from imblearn.over_sampling import SMOTE
from sklearn.datasets import make_classification

# ダミーデータの生成（例として）
X, y = make_classification(n_classes=2, class_sep=2,
                           weights=[0.1, 0.9], n_informative=3,
                           n_redundant=1, flip_y=0,
                           n_features=20, n_clusters_per_class=1,
                           n_samples=1000, random_state=10)

# SMOTEを使ったオーバーサンプリング
smote = SMOTE(random_state=42)
X_resampled, y_resampled = smote.fit_resample(X, y)

# オーバーサンプリング後のクラスごとのサンプル数を確認
import numpy as np
unique, counts = np.unique(y_resampled, return_counts=True)
dict(zip(unique, counts))

このコードでは、make_classification関数を使用してダミーデータを生成し、SMOTEを使ってオーバーサンプリングを行っています。最後に、オーバーサンプリング後のクラスごとのサンプル数を確認しています。SMOTEの他にも、アンダーサンプリングの手法もimbalanced-learnライブラリに含まれていますので、適宜調査して利用してみてください。

未分類

Posted by ぼっち

# モデルの学習 model.fit(x_train, y_train, batch_size=64, epochs=10, validation_split=0.2) これの

梱包サイズを予測するモデルを作ってるんだけど、aucが80だけどaccuracyは55くらいなんだよね

コメント一覧

まだ、コメントがありません