sklearn.impute モジュールとは

sklearn.impute モジュールには、欠損値を補完するためのツールが含まれています。その中で最も一般的なものは SimpleImputer クラスです。このクラスは、欠損値を一定の値(例えば、平均値、中央値、最頻値)で補完するために使用されます。

以下は、SimpleImputer を使った基本的な使い方の例です:

python
from sklearn.impute import SimpleImputer
import numpy as np

# サンプルデータ
X = np.array([[1, 2], [np.nan, 3], [7, 6]])

# 欠損値を平均値で補完するImputerを作成します
imputer = SimpleImputer(strategy='mean')

# 欠損値の補完を行います
X_imputed = imputer.fit_transform(X)

print(X_imputed)

この例では、欠損値を含むデータ X を定義し、その欠損値を平均値で補完するために SimpleImputer クラスを使用しています。strategy パラメータを使用して、補完の方法を指定できます。他にも、median(中央値)、most_frequent(最頻値)、または任意の定数値を指定することができます。

fit_transform() メソッドは、補完を実行し、欠損値が補完されたデータを返します。

このようにして、欠損値を補完するために SimpleImputer クラスを使用できます。

未分類

Posted by ぼっち