Pythonのpandasとは サンプルコード有り
pandasは、Pythonのデータ操作と解析ライブラリの一つであり、データを取り込み、変換、結合、分析、視覚化するための強力なツールです。以下に、pandasを使用した基本的な操作とサンプルコードを示します。
まず、pandasライブラリをインポートします。
import pandas as pd
データの作成と表示:
pandasの基本的なデータ構造は「DataFrame」です。これはテーブルのような2次元のデータ構造です。以下は、簡単なDataFrameを作成し、表示する例です。
# データフレームの作成
data = {'名前': ['Alice', 'Bob', 'Charlie'],
'年齢': [25, 30, 35]}
df = pd.DataFrame(data)
# データフレームの表示
print(df)
データの選択:
データフレームから特定の列や行を選択する方法です。
# 特定の列を選択 ages = df['年齢'] # 特定の行を選択 row = df.loc[0] # インデックス0の行を選択 # 条件に合致する行を選択 young_people = df[df['年齢'] < 30]
データのフィルタリング:
条件に合致するデータをフィルタリングする方法です。
# 年齢が30未満の行を選択 young_people = df[df['年齢'] < 30]
データのグループ化:
データをグループ化して集計する方法です。
# 年齢ごとにグループ化し、平均年齢を計算
age_groups = df.groupby('年齢').mean()
データのソート:
データをソートする方法です。
# 年齢でデータを昇順ソート sorted_df = df.sort_values(by='年齢')
データの保存と読み込み:
データをファイルに保存したり、ファイルから読み込んだりする方法です。
# データフレームをCSVファイルに保存
df.to_csv('data.csv', index=False)
# CSVファイルからデータフレームに読み込み
loaded_df = pd.read_csv('data.csv')
これらはpandasの基本的な機能の一部です。pandasは非常に豊富な機能を提供しており、データ分析や前処理に広く使用されています。詳細な情報は公式ドキュメントを参照することをお勧めします。

ディスカッション
コメント一覧
まだ、コメントがありません