Pandasのメソッド説明 pandas.pivot

Pandasのpandas.pivotメソッドは、データフレーム内のデータをピボットテーブル形式に変換するためのメソッドです。ピボットテーブルは、行と列の交差点に値を配置し、データを集計して要約統計情報を計算するのに役立ちます。pivotメソッドは、データを変換し、集計するための一般的な方法の1つです。以下は、pandas.pivotメソッドの基本的な使い方と主要なパラメータの説明です。

基本的な使用法:

python
import pandas as pd

# サンプルデータフレームを作成
data = {'Date': ['2023-01-01', '2023-01-02', '2023-01-01', '2023-01-02'],
        'Category': ['A', 'A', 'B', 'B'],
        'Value': [10, 20, 30, 40]}
df = pd.DataFrame(data)

# ピボットテーブルを作成
pivot_table = df.pivot(index='Date', columns='Category', values='Value')

# ピボットテーブルを表示
print(pivot_table)

この例では、pandas.pivotメソッドを使用して、元のデータフレームdfをピボットテーブルに変換しました。indexパラメータには行のインデックスとして使用する列(ここでは’Date’列)を指定し、columnsパラメータには列のヘッダーとして使用する列(ここでは’Category’列)を指定し、valuesパラメータにはピボットテーブルの値として使用する列(ここでは’Value’列)を指定します。

注意事項:

  • pivotメソッドは、元のデータフレーム内の組み合わせが一意であることを前提としています。つまり、同じ行と列の組み合わせが複数存在する場合にはエラーが発生します。

重要なポイント:
pivotメソッドは、ユーザーがピボットテーブル形式のデータを作成するのに便利ですが、元のデータが重複した行を含む場合にはエラーが発生します。この場合、pivot_tableメソッドを使用するか、重複した値を処理する必要があります。