Pythonのpandasメソッド query

2023年10月9日

pandasqueryメソッドは、データフレーム内のデータを特定の条件に基づいてフィルタリングするための便利なメソッドです。queryメソッドを使用すると、SQLスタイルのクエリを使ってデータを選択できます。

以下は、queryメソッドの基本的な使い方です:

python
import pandas as pd

# サンプルのDataFrameを作成する
data = {'名前': ['Alice', 'Bob', 'Charlie', 'David', 'Eve'],
        '年齢': [25, 30, 35, 28, 22],
        '性別': ['女性', '男性', '女性', '男性', '女性']}

df = pd.DataFrame(data)

# queryメソッドを使用して特定の条件でデータをフィルタリングする
filtered_data = df.query('年齢 > 25 and 性別 == "男性"')

# 結果を表示する
print(filtered_data)

上記のコードでは、queryメソッドを使用して、DataFrame df から年齢が25より大きく、性別が"男性"である行をフィルタリングしています。結果として、指定した条件に一致する行のデータを含む新しいデータフレーム filtered_data が生成されます。

queryメソッドの主な特徴は以下です:

  • SQLスタイルのクエリを使用してデータをフィルタリングできます。
  • クエリ内で変数を使用する場合、変数は@を前置詞として指定します。
  • 複雑な条件や複数の条件を組み合わせてデータをフィルタリングできます。

queryメソッドは、データフレーム内のデータを柔軟にフィルタリングする際に非常に便利です。特定の条件に基づいてデータを抽出し、必要な情報だけを含む新しいデータフレームを作成するのに役立ちます。