Pythonで正規化する方法は？

2024年6月8日

Pythonでデータを正規化する方法はいくつかありますが、最も一般的な方法は以下の2つです。

最小-最大スケーリング（Min-Max Scaling）:
この手法では、データを特定の範囲にスケーリングします。通常、0から1の範囲に変換されますが、任意の範囲に変換することもできます。以下は、scikit-learnライブラリを使用して最小-最大スケーリングを行う方法の例です。

python
from sklearn.preprocessing import MinMaxScaler

# データを用意する（例えば、numpy配列とする）
data = [[-1, 2], [-0.5, 6], [0, 10], [1, 18]]

# 最小-最大スケーラーを作成して適用する
scaler = MinMaxScaler()
scaled_data = scaler.fit_transform(data)

print(scaled_data)

標準化（Standardization）:
この手法では、データを平均が0、標準偏差が1の正規分布に変換します。これにより、データが正規分布に近くなります。以下は、scikit-learnライブラリを使用して標準化を行う方法の例です。

python
from sklearn.preprocessing import StandardScaler

# データを用意する（例えば、numpy配列とする）
data = [[-1, 2], [-0.5, 6], [0, 10], [1, 18]]

# 標準スケーラーを作成して適用する
scaler = StandardScaler()
scaled_data = scaler.fit_transform(data)

print(scaled_data)

これらの方法は、データの前処理や特徴量スケーリングに広く使用されています。特に機械学習やデータ分析の文脈でよく使用されます。

未分類

Posted by ぼっち

最小最大スケーリングのデメリットは？標準化とどうちがう？