Pythonのpandasメソッド pandas.pivot

2023年10月9日

pandaspivotメソッドは、データフレーム内のデータを再形成し、新しいデータ構造を生成するためのメソッドです。主に集計やクロス集計(クロス集計テーブル)を行うのに使用されます。このメソッドは、pivot_tableメソッドと似ていますが、集計関数を適用せずにデータを変換します。

以下は、pivotメソッドの基本的な使い方です:

python
import pandas as pd

# サンプルのデータフレームを作成する
data = {'日付': ['2023-01-01', '2023-01-01', '2023-01-02', '2023-01-02', '2023-01-01'],
        '商品': ['A', 'B', 'A', 'B', 'A'],
        '売上': [100, 150, 200, 120, 180]}

df = pd.DataFrame(data)

# ピボットテーブルを作成する
pivot_table = df.pivot(index='日付', columns='商品', values='売上')

# 結果を表示する
print(pivot_table)

上記のコードでは、pivotメソッドを使用して、元のデータフレーム df のデータを再形成し、日付ごとの商品別の売上を示す新しいデータフレーム pivot_table を作成しています。

pivotメソッドの主な特徴は以下です:

  • index引数に行のグループ化キーを指定し、columns引数に列のグループ化キーを指定します。
  • values引数にデータとして使用する列を指定します。

pivotメソッドは、データの形状を変更して、データの特徴を理解しやすくするのに役立ちます。データのクロス集計や集計結果を得る際に使用されます。ただし、集計関数を適用せずにデータを変換するため、集計を行う場合にはpivot_tableメソッドの方が一般的に使用されます。