Pythonのpandasメソッド read_csv

2023年10月9日

pandasread_csvメソッドは、CSV(Comma-Separated Values)ファイルからデータを読み込むための非常に便利な機能です。CSVファイルは、テキストファイルで、データをコンマや他の区切り文字で区切って格納するための一般的なフォーマットです。pandasread_csvメソッドを使用すると、CSVファイルからデータをDataFrameとして読み込むことができます。

基本的な使い方は以下の通りです:

python
import pandas as pd

# CSVファイルを読み込む
df = pd.read_csv('ファイルのパス.csv')

# DataFrameを操作するコードを書く
# 例: 最初の5行を表示する
print(df.head())

read_csvメソッドには多くのオプションがあり、データの読み込み方法をカスタマイズできます。以下に一部の一般的なオプションを示します:

  • delimiterまたはsep: 列を区切るための文字を指定します。デフォルトはカンマですが、他の文字(タブ、セミコロンなど)を指定することもできます。
python
# タブで区切られたファイルを読み込む例
df = pd.read_csv('ファイルのパス.txt', delimiter='t')
  • header: ヘッダー行があるかどうかを指定します。デフォルトは0で、最初の行がヘッダー行として扱われます。ヘッダーがない場合はNoneを指定します。
python
# ヘッダー行がない場合
df = pd.read_csv('ファイルのパス.csv', header=None)
  • index_col: インデックス列を指定します。デフォルトではインデックスは自動的に生成されますが、特定の列をインデックスとして使用することができます。
python
# 列 "ID" をインデックスとして使用する例
df = pd.read_csv('ファイルのパス.csv', index_col='ID')

これらは一般的なread_csvメソッドのオプションの一部です。他にも多くのオプションがあり、データのフォーマットに合わせて調整できます。pandasの公式ドキュメントに詳細な情報がありますので、必要に応じて参照してください。