具体的なサンプルコードちょうだい
以下はPythonでのSMOTE(Synthetic Minority Over-sampling Technique)を使ったオーバーサンプリングのサンプルコードです。SMOTEはimbalanced-learnライブラリから利用できます。
python
from imblearn.over_sampling import SMOTE from sklearn.datasets import make_classification # ダミーデータの生成(例として) X, y = make_classification(n_classes=2, class_sep=2, weights=[0.1, 0.9], n_informative=3, n_redundant=1, flip_y=0, n_features=20, n_clusters_per_class=1, n_samples=1000, random_state=10) # SMOTEを使ったオーバーサンプリング smote = SMOTE(random_state=42) X_resampled, y_resampled = smote.fit_resample(X, y) # オーバーサンプリング後のクラスごとのサンプル数を確認 import numpy as np unique, counts = np.unique(y_resampled, return_counts=True) dict(zip(unique, counts))
このコードでは、make_classification関数を使用してダミーデータを生成し、SMOTEを使ってオーバーサンプリングを行っています。最後に、オーバーサンプリング後のクラスごとのサンプル数を確認しています。SMOTEの他にも、アンダーサンプリングの手法もimbalanced-learnライブラリに含まれていますので、適宜調査して利用してみてください。

ディスカッション
コメント一覧
まだ、コメントがありません