Pythonのpandasメソッド str.contains

2023年10月9日

pandasstr.containsメソッドは、文字列の列(Series)内の各要素に対して指定した部分文字列が含まれているかどうかを確認するためのメソッドです。このメソッドを使用することで、文字列データの中から特定のパターンを検索したり、フィルタリングしたりできます。

以下は、str.containsメソッドの基本的な使い方です:

python
import pandas as pd

# サンプルのDataFrameを作成する
data = {'名前': ['Alice', 'Bob', 'Charlie', 'David', 'Eve'],
        '都市': ['New York', 'Los Angeles', 'Chicago', 'San Francisco', 'Miami']}

df = pd.DataFrame(data)

# 特定の部分文字列が含まれているか確認する
contains_new = df['都市'].str.contains('New')

# 結果を表示する
print(contains_new)

上記のコードでは、str.containsメソッドを使用して、DataFrame df の"都市"列内の各要素が"New"という部分文字列を含んでいるかどうかを確認しています。結果として、真偽値のSeries contains_new が生成され、各要素に対して含まれているかどうかを示します。

str.containsメソッドの主な特徴は以下です:

  • 各要素に対して指定した部分文字列の存在を確認し、真偽値のSeriesを返します。
  • 正規表現を使用してパターンを指定できます。
  • 大文字と小文字を区別するかどうかを設定するcase引数を指定できます。

str.containsメソッドは、テキストデータ内の特定のパターンを検索したり、データをフィルタリングしたりする際に役立ちます。例えば、都市名の中から特定の文字列を含む都市を抽出する場合などに使用されます。