Pythonのpandasメソッド assign

2023年10月9日

pandasassignメソッドは、新しい列を含むDataFrameのコピーを返すための便利なメソッドです。このメソッドを使用することで、既存のDataFrameに新しい列を追加したり、既存の列を変更したりすることができます。assignメソッドは、データフレームに変更を加えずに新しいデータフレームを生成するため、チェイン操作と組み合わせて使用することができます。

基本的な使い方は以下の通りです:

python
import pandas as pd

# サンプルのDataFrameを作成する
data = {'名前': ['Alice', 'Bob', 'Charlie'],
        '年齢': [25, 30, 35]}

df = pd.DataFrame(data)

# assignメソッドを使用して新しい列を追加する
df_new = df.assign(身長=[160, 175, 180])

# 結果を表示する
print(df_new)

上記のコードでは、assignメソッドを使用してDataFrame df に新しい列 “身長" を追加しています。結果として、新しいDataFrame df_new が生成され、新しい列が含まれています。

assignメソッドの主要な引数は以下です:

  • **kwargs: 列名とその値をキーワード引数として渡します。これにより、新しい列がDataFrameに追加されます。

assignメソッドは、データの加工、新しい特徴量の生成、一時的な操作のために非常に便利です。特に、データの処理パイプラインを効果的に構築する際に、assignメソッドを使用して途中経過のデータフレームを生成することができます。