Pythonのpandasメソッド Serise.apply

2023年10月9日

pandasSeries.applyメソッドは、Series内の各要素に対して指定した関数を適用するためのメソッドです。このメソッドを使用すると、Series内のデータを一括して変換、操作、または処理することができます。

基本的な使い方は以下の通りです:

python
import pandas as pd

# サンプルのSeriesを作成する
data = [1, 2, 3, 4, 5]
s = pd.Series(data)

# 各要素に対して関数を適用する
result = s.apply(lambda x: x * 2)

# 結果を表示する
print(result)

上記のコードでは、lambda関数を使用して各要素を2倍にする操作をapplyメソッドを使って行っています。結果として、各要素が2倍にされた新しいSeries result が得られます。

applyメソッドの主な引数は以下です:

  • func: 適用したい関数を指定します。この関数はSeriesの各要素に対して呼び出されます。
  • argsおよび**kwargs: 関数に渡す追加の引数やキーワード引数を指定します。

applyメソッドは、データの変換、操作、およびカスタム関数の適用に役立ちます。たとえば、データの正規化、カテゴリカルデータのエンコーディング、要約統計量の計算など、さまざまなデータ処理タスクに使用できます。また、Series内の各要素に対して柔軟な操作を適用できるため、データの前処理や特徴量エンジニアリングにも適しています。