Pythonのsklearnメソッド datasets
scikit-learn(sklearn)のdatasetsモジュールには、機械学習の実験や練習用に使用できるいくつかの標準的なデータセットが含まれています。これらのデータセットは、機械学習アルゴリズムのテスト、評価、デモンストレーションに役立ちます。datasetsモジュールには以下のようなデータセットが含まれています:
-
load_iris: Irisデータセットは、アヤメの花の3つの品種(Setosa、Versicolor、Virginica)に関する情報を含むデータセットです。分類タスクの練習に使用されます。
-
load_digits: 手書き数字(0から9までの数字)の画像データセットです。数字認識のタスクに使用されます。
-
load_boston: Boston Housingデータセットは、ボストン市の住宅価格に関する情報を含むデータセットで、回帰タスクの練習に使用されます。
-
load_diabetes: 糖尿病患者のデータセットで、1年後の疾患進行率を予測するための回帰タスクに使用されます。
-
load_linnerud: Linnerudデータセットは、20人の男性に対する3つの生理学的特徴量(重量、ウエイトリフティングのチンアップ数、腹筋の回数)と3つのパフォーマンス特徴量(チンアップ、シットアップ、ジョギング)から成るデータセットです。
-
fetch_openml: OpenMLからデータセットをダウンロードし、ローカルに保存するための関数です。OpenMLは多くの機械学習データセットのリポジトリです。
これらのデータセットは、次のように簡単に取得できます:
python
from sklearn.datasets import load_iris # Irisデータセットの読み込み iris = load_iris() # データとラベルを取得 X = iris.data # 特徴量 y = iris.target # クラスラベル
上記の例では、load_iris関数を使用してIrisデータセットを読み込み、データとラベルを変数Xとyに格納しています。同様に、他のデータセットもdatasetsモジュールから読み込むことができます。これらのデータセットは、機械学習の学習や評価のために非常に便利です。

ディスカッション
コメント一覧
まだ、コメントがありません