Pythonのsklearnメソッド datasets

scikit-learn(sklearn)のdatasetsモジュールには、機械学習の実験や練習用に使用できるいくつかの標準的なデータセットが含まれています。これらのデータセットは、機械学習アルゴリズムのテスト、評価、デモンストレーションに役立ちます。datasetsモジュールには以下のようなデータセットが含まれています:

  1. load_iris: Irisデータセットは、アヤメの花の3つの品種(Setosa、Versicolor、Virginica)に関する情報を含むデータセットです。分類タスクの練習に使用されます。

  2. load_digits: 手書き数字(0から9までの数字)の画像データセットです。数字認識のタスクに使用されます。

  3. load_boston: Boston Housingデータセットは、ボストン市の住宅価格に関する情報を含むデータセットで、回帰タスクの練習に使用されます。

  4. load_diabetes: 糖尿病患者のデータセットで、1年後の疾患進行率を予測するための回帰タスクに使用されます。

  5. load_linnerud: Linnerudデータセットは、20人の男性に対する3つの生理学的特徴量(重量、ウエイトリフティングのチンアップ数、腹筋の回数)と3つのパフォーマンス特徴量(チンアップ、シットアップ、ジョギング)から成るデータセットです。

  6. fetch_openml: OpenMLからデータセットをダウンロードし、ローカルに保存するための関数です。OpenMLは多くの機械学習データセットのリポジトリです。

これらのデータセットは、次のように簡単に取得できます:

python
from sklearn.datasets import load_iris # Irisデータセットの読み込み iris = load_iris() # データとラベルを取得 X = iris.data # 特徴量 y = iris.target # クラスラベル

上記の例では、load_iris関数を使用してIrisデータセットを読み込み、データとラベルを変数Xとyに格納しています。同様に、他のデータセットもdatasetsモジュールから読み込むことができます。これらのデータセットは、機械学習の学習や評価のために非常に便利です。

未分類

Posted by ぼっち