Pandasのメソッド説明 DataFrame.query

PandasのDataFrame.queryメソッドは、データフレーム内のデータを条件を指定してフィルタリングするための強力なメソッドです。このメソッドを使用することで、SQLスタイルのクエリを使用してデータを抽出できます。以下は、DataFrame.queryメソッドの一般的な使い方と主要なパラメータの説明です。

基本的な使用法:

python
import pandas as pd

# サンプルデータフレームを作成
data = {'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Eva'],
        'Age': [25, 30, 35, 40, 45]}
df = pd.DataFrame(data)

# queryメソッドを使用してデータをフィルタリング
filtered_df = df.query('Age > 30')

# フィルタリングされたデータフレームを表示
print(filtered_df)

この例では、queryメソッドを使用して、df内の’Age’列が30より大きい行をフィルタリングし、その結果をfiltered_df変数に格納しています。

複数の条件を組み合わせる:

queryメソッドを使用すると、複数の条件を組み合わせてデータをフィルタリングできます。

python
# 年齢が30以上かつ名前が'B'から始まる行をフィルタリング
filtered_df = df.query('Age >= 30 and Name.str.startswith("B")')

# フィルタリングされたデータフレームを表示
print(filtered_df)

この例では、queryメソッドを使用して、年齢が30以上かつ名前が’B’で始まる行をフィルタリングしています。

DataFrame.queryメソッドは、データフレーム内のデータを柔軟にフィルタリングするための効果的な方法を提供します。条件を文字列として指定することで、SQLのようなクエリを使用してデータを抽出できます。これはデータ分析やデータ操作において非常に便利なツールです。