Pythonのpandasメソッド agg

2023年10月9日

pandasagg(aggregateの略)メソッドは、DataFrameやSeries内のデータに対して複数の異なる集計関数を適用するためのメソッドです。aggメソッドを使用することで、特定の列や要素に対して複数の集計結果を一度に取得できます。

以下は、aggメソッドの基本的な使い方です:

python
import pandas as pd

# サンプルのDataFrameを作成する
data = {'A': [1, 2, 3, 4, 5],
        'B': [5, 4, 3, 2, 1]}

df = pd.DataFrame(data)

# 列ごとに異なる集計関数を適用する
agg_result = df.agg({'A': 'sum', 'B': 'mean'})

# 結果を表示する
print(agg_result)

上記のコードでは、aggメソッドを使用して、DataFrame df 内の列 'A’ には合計を、列 'B’ には平均を計算しています。結果として、各列に対する異なる集計結果を持つシリーズ agg_result が生成されます。

aggメソッドの主な特徴は以下です:

  • 集計関数は辞書形式で指定し、列ごとに異なる関数を適用できます。
  • 集計関数は文字列(’sum’、’mean’、’median’、’max’、’min’など)または関数オブジェクトとして指定できます。
  • 複数の集計関数を同時に適用でき、結果は新しいデータフレームやシリーズとして得られます。

aggメソッドは、データフレーム内の複数の列に対して異なる集計を実行し、データの要約統計を取得するのに役立ちます。特定の列に対する複数の情報を一度に抽出するのに便利です。