過去5年分のデータがあるから、年月で集計したい df

2024年6月17日

提供されたコードは、与えられたCSVファイルを読み込んで、月ごとの数量を集計し、平均値を計算し、カテゴリ変数について最初のデータを取得しています。ただし、このコードは現在、月ごとの数量の集計しか行っていません。年月で集計するためには、年と月の情報を含む新しい列を作成し、その列を使用してグループ化を行う必要があります。

以下は、提供されたコードを修正して、年月で集計する方法です:

python
import pandas as pd

# CSVファイルからDataFrameを読み込む
df = pd.read_csv("jutyu_data.csv", parse_dates=["受注日"], encoding="cp932")

# 年月の列を作成する
df["年月"] = df["受注日"].dt.to_period("M")

# 年月ごとの数量を集計する
monthly_quantity = df.groupby(["自社品番", "年月"])["数量"].sum().reset_index()

# 平均値を計算する
mean_values = df.groupby("自社品番").mean().reset_index()

# カテゴリ変数については最初のデータを取得して集計する
first_values = df.groupby("自社品番").first().reset_index()

# 結果を表示する
print("年月ごとの数量:")
print(monthly_quantity)

print("n平均値:")
print(mean_values)

print("n最初のデータ:")
print(first_values)

この修正により、年月列が作成され、その列を使用して年月ごとに数量を集計することができます。

未分類

Posted by ぼっち