Pythonのreで全角の日本語と英数字にマッチする正規表現

2023年10月18日

Pythonのreモジュールを使用して、全角の日本語文字と英数字にマッチする正規表現を作成するには、Unicodeのカテゴリを使用します。具体的には、p{L}は文字のカテゴリ（Letter）に一致し、p{N}は数字のカテゴリ（Number）に一致します。正規表現内でp{L}とp{N}を使用して、全角の日本語文字と英数字に一致するパターンを作成できます。

以下は、全角の日本語文字と英数字に一致する正規表現の例です：

python
import re

text = "日本語ABC１２３漢字"
pattern = r'[p{L}p{N}]+'

matches = re.findall(pattern, text)

for match in matches:
    print(match)

この正規表現パターン [p{L}p{N}]+ は、文字クラス [] を使用して、文字カテゴリ p{L}（文字）または p{N}（数字）に一致する1文字以上の文字列を検索します。したがって、日本語の文字、英字、数字が含まれているテキスト内のすべての文字列を一致させます。

この正規表現を使用することで、全角の日本語文字と英数字を含むテキスト内の適切な箇所を一致させることができます。

re,目的別,Python,プログラミング

Posted by ぼっち

Pythonのreで小文字・大文字の両方の英語にマッチする正規表現

Pythonのreでマッチ（一致箇所）した文字列をグループ化する方法

コメント一覧

まだ、コメントがありません