Pythonのpandasとは サンプルコード有り

pandasは、Pythonのデータ操作と解析ライブラリの一つであり、データを取り込み、変換、結合、分析、視覚化するための強力なツールです。以下に、pandasを使用した基本的な操作とサンプルコードを示します。

まず、pandasライブラリをインポートします。

import pandas as pd

データの作成と表示:

pandasの基本的なデータ構造は「DataFrame」です。これはテーブルのような2次元のデータ構造です。以下は、簡単なDataFrameを作成し、表示する例です。

# データフレームの作成
data = {'名前': ['Alice', 'Bob', 'Charlie'],
        '年齢': [25, 30, 35]}

df = pd.DataFrame(data)

# データフレームの表示
print(df)

データの選択:

データフレームから特定の列や行を選択する方法です。

# 特定の列を選択
ages = df['年齢']

# 特定の行を選択
row = df.loc[0]  # インデックス0の行を選択

# 条件に合致する行を選択
young_people = df[df['年齢'] < 30]

データのフィルタリング:

条件に合致するデータをフィルタリングする方法です。

# 年齢が30未満の行を選択
young_people = df[df['年齢'] < 30]

データのグループ化:

データをグループ化して集計する方法です。

# 年齢ごとにグループ化し、平均年齢を計算
age_groups = df.groupby('年齢').mean()

データのソート:

データをソートする方法です。

# 年齢でデータを昇順ソート
sorted_df = df.sort_values(by='年齢')

データの保存と読み込み:

データをファイルに保存したり、ファイルから読み込んだりする方法です。

# データフレームをCSVファイルに保存
df.to_csv('data.csv', index=False)

# CSVファイルからデータフレームに読み込み
loaded_df = pd.read_csv('data.csv')

これらはpandasの基本的な機能の一部です。pandasは非常に豊富な機能を提供しており、データ分析や前処理に広く使用されています。詳細な情報は公式ドキュメントを参照することをお勧めします。