Pythonのpandasメソッド filter

2023年10月9日

pandasfilterメソッドは、データフレーム内の特定の行または列を選択するためのメソッドです。このメソッドを使用することで、行や列のラベルに基づいてデータを抽出できます。

以下は、filterメソッドの基本的な使い方です:

python
import pandas as pd

# サンプルのDataFrameを作成する
data = {'名前': ['Alice', 'Bob', 'Charlie', 'David', 'Eve'],
        '年齢': [25, 30, 35, 28, 22],
        '性別': ['女性', '男性', '女性', '男性', '女性']}

df = pd.DataFrame(data)

# filterを使用して特定の列を選択する
selected_columns = df.filter(items=['名前', '性別'])

# 結果を表示する
print(selected_columns)

上記のコードでは、filterメソッドを使用して、DataFrame df から"名前"と"性別"という列を選択しています。結果として、指定した列だけを含む新しいデータフレーム selected_columns が生成されます。

filterメソッドの主な使い方は以下です:

  • items引数を使用して、選択したい列のラベルを指定します。この引数はリストやタプルとして指定します。
  • like引数を使用して、列ラベルに特定の部分文字列が含まれている列を選択します。
  • regex引数を使用して、正規表現パターンに一致する列を選択します。

filterメソッドは、データフレーム内の特定の列を選択する際に役立ちます。特定の列のデータを抽出し、必要な情報だけを含む新しいデータフレームを作成するのに便利です。