pandas のto_csvメソッドがサポートしているエンコーディングの一覧2

2024年6月18日

以下は、いくつかの一般的なエンコーディングです。データの特性によって最適なエンコーディングを選択してください。

  1. UTF-16 (utf-16): ユニコードのエンコーディングで、マルチバイト文字をサポートします。LE(リトルエンディアン)またはBE(ビッグエンディアン)のいずれかを指定できます。
    python
    df.to_csv('output.csv', encoding='utf-16', index=False)
    
  2. UTF-32 (utf-32): ユニコードのエンコーディングで、UTF-32 LE(リトルエンディアン)またはBE(ビッグエンディアン)を指定できます。
    python
    df.to_csv('output.csv', encoding='utf-32', index=False)
    
  3. ISO-8859-15 (iso-8859-15): ISO-8859-1 の改良版で、ヨーロッパの多くの言語をサポートします。
    python
    df.to_csv('output.csv', encoding='iso-8859-15', index=False)
    
  4. MacJapanese (mac_japanese): 日本語のエンコーディングで、Macintoshの旧式のエンコーディング方式です。
    python
    df.to_csv('output.csv', encoding='mac_japanese', index=False)
    

これらは一部の例であり、pandas がサポートしているエンコーディングは他にも多数あります。データの性質に合わせて選択してください。

未分類

Posted by ぼっち