Pandasのメソッド説明 DataFrame.agg
PandasのDataFrame.aggメソッドは、データフレーム内の列に対して指定した集計関数(または関数のリスト)を適用し、列ごとにカスタムの集計操作を行うためのメソッドです。aggメソッドは、データフレーム内の複数の列に異なる集計操作を適用する場合や、複数の統計情報を同時に計算する場合に特に有用です。以下は、DataFrame.aggメソッドの一般的な使い方と主要なパラメータの説明です。
基本的な使用法:
python
import pandas as pd
# サンプルデータフレームを作成
data = {'A': [1, 2, 3, 4, 5],
'B': [10, 20, 30, 40, 50]}
df = pd.DataFrame(data)
# 列ごとに平均値と合計値を計算
agg_result = df.agg(['mean', 'sum'])
# 集計結果を表示
print(agg_result)
この例では、aggメソッドを使用して、データフレームdf内の各列に対して平均値と合計値を計算し、結果として得られるデータフレームagg_resultに集計情報が含まれています。
カスタムの集計関数を使用:
aggメソッドには、ビルトインの集計関数(’mean’、’sum’、’min’、’max’など)の他に、ユーザーが定義したカスタムの関数を適用することもできます。
python
# カスタムの集計関数を定義
def custom_mean(x):
return x.mean() * 2
# カスタム関数を使用して列ごとに集計
custom_agg_result = df.agg(custom_mean)
# 集計結果を表示
print(custom_agg_result)
特定の列に対して集計:
aggメソッドを特定の列に対して適用する場合、subsetパラメータを使用して列を指定できます。
python # 'A'列に対して平均値と合計値を計算 agg_result_column_A = df['A'].agg(['mean', 'sum']) # 集計結果を表示 print(agg_result_column_A)
DataFrame.aggメソッドは、データフレーム内の列ごとにカスタムの集計操作を実行する場合や、複数の統計情報を一度に取得する場合に非常に便利です。データの要約統計情報を柔軟に計算し、データ分析や可視化のためのデータの事前処理に使用されます。

ディスカッション
コメント一覧
まだ、コメントがありません