pandas errors=”replaceのやり方

2024年6月25日

errors="replace"を使用すると、エンコーディング中にエラーが発生した文字が置き換えられます。以下は、to_csv()メソッドでerrors="replace"を使用する方法です。

python
import pandas as pd

# DataFrameを作成する例としてダミーデータを使用します
data = {
    "column1": ["some text", "some text with invalid characters ~", "more text"],
    "column2": [1, 2, 3]
}
df = pd.DataFrame(data)

# CSVファイルに書き込む際にエンコーディングエラーが発生する場合、"replace"オプションを使用して置き換えます
df.to_csv("output.csv", encoding="shift_jis", errors="replace", index=False)

このコードでは、DataFrameのデータをShift-JISエンコーディングでCSVファイルに書き込む際に、エンコーディングエラーが発生した文字を?で置き換えます。index=Falseは、DataFrameのインデックスをCSVファイルに書き込まないようにするためのオプションです。

未分類

Posted by ぼっち