pandas のto_csvメソッドがサポートしているエンコーディングの一覧

2024年6月18日

pandasto_csvメソッドがサポートしているエンコーディングの一覧です。Pythonのcodecsモジュールでサポートされているエンコーディングはほとんどpandasでも利用できます。

以下は、いくつかの一般的なエンコーディングの一覧ですが、これに限らず他にも多くのエンコーディングが存在します。

  1. UTF-8 (utf-8):
    python
    df.to_csv('output.csv', encoding='utf-8', index=False)
    
  2. UTF-16 (utf-16):
    python
    df.to_csv('output.csv', encoding='utf-16', index=False)
    
  3. UTF-32 (utf-32):
    python
    df.to_csv('output.csv', encoding='utf-32', index=False)
    
  4. ISO-8859-1 (iso-8859-1):
    python
    df.to_csv('output.csv', encoding='iso-8859-1', index=False)
    
  5. Shift JIS (shift_jis):
    python
    df.to_csv('output.csv', encoding='shift_jis', index=False)
    
  6. EUC-JP (euc_jp):
    python
    df.to_csv('output.csv', encoding='euc_jp', index=False)
    
  7. ISO-2022-JP (iso2022_jp):
    python
    df.to_csv('output.csv', encoding='iso2022_jp', index=False)
    
  8. MacJapanese (mac_japanese):
    python
    df.to_csv('output.csv', encoding='mac_japanese', index=False)
    
  9. CP932 (cp932):
    python
    df.to_csv('output.csv', encoding='cp932', index=False)
    
  10. IBM437 (ibm437):
    python
    df.to_csv('output.csv', encoding='ibm437', index=False)
    
  11. Windows-1252 (windows-1252):
    python
    df.to_csv('output.csv', encoding='windows-1252', index=False)
    
  12. Latin-1 (latin-1):
    python
    df.to_csv('output.csv', encoding='latin-1', index=False)
    
  13. ASCII (ascii):
    python
    df.to_csv('output.csv', encoding='ascii', index=False)
    

これらは一般的なエンコーディングのいくつかであり、他にも多くのエンコーディングが利用可能です。データの性質に合わせて適切なエンコーディングを選択してください。

未分類

Posted by ぼっち