Pythonで正規化する方法は?

Pythonでデータを正規化する方法はいくつかありますが、最も一般的な方法は以下の2つです。

  1. 最小-最大スケーリング(Min-Max Scaling):
    この手法では、データを特定の範囲にスケーリングします。通常、0から1の範囲に変換されますが、任意の範囲に変換することもできます。以下は、scikit-learnライブラリを使用して最小-最大スケーリングを行う方法の例です。
python
from sklearn.preprocessing import MinMaxScaler # データを用意する(例えば、numpy配列とする) data = [[-1, 2], [-0.5, 6], [0, 10], [1, 18]] # 最小-最大スケーラーを作成して適用する scaler = MinMaxScaler() scaled_data = scaler.fit_transform(data) print(scaled_data)
  1. 標準化(Standardization):
    この手法では、データを平均が0、標準偏差が1の正規分布に変換します。これにより、データが正規分布に近くなります。以下は、scikit-learnライブラリを使用して標準化を行う方法の例です。
python
from sklearn.preprocessing import StandardScaler # データを用意する(例えば、numpy配列とする) data = [[-1, 2], [-0.5, 6], [0, 10], [1, 18]] # 標準スケーラーを作成して適用する scaler = StandardScaler() scaled_data = scaler.fit_transform(data) print(scaled_data)

これらの方法は、データの前処理や特徴量スケーリングに広く使用されています。特に機械学習やデータ分析の文脈でよく使用されます。

未分類

Posted by ぼっち