Pythonのpandasメソッド set_index

2023年10月9日

pandasset_indexメソッドは、DataFrame内の1つまたは複数の列を新しいインデックスとして設定するためのメソッドです。これにより、特定の列の値を行のラベルとして使用することができます。set_indexメソッドは、データのインデックスを変更するのに役立ちます。

基本的な使い方は以下の通りです:

python
import pandas as pd

# サンプルのDataFrameを作成する
data = {'名前': ['Alice', 'Bob', 'Charlie'],
        '年齢': [25, 30, 35]}

df = pd.DataFrame(data)

# '名前'列を新しいインデックスとして設定する
df.set_index('名前', inplace=True)

# 新しいインデックスを持つDataFrameを表示する
print(df)

上記のコードを実行すると、’名前’列が新しいインデックスとして設定されたDataFrameが得られます:

markdown
        年齢
名前       
Alice   25
Bob     30
Charlie 35

set_indexメソッドの主要な引数は以下です:

  • keysまたはlevel: 新しいインデックスとして設定したい列名または列名のリストを指定します。
  • inplace: インデックスを変更したDataFrameをインプレースで更新するかどうかを指定します。デフォルトはFalseです。

set_indexメソッドは、DataFrame内のデータを特定の列の値に基づいて検索やフィルタリングする際に便利です。また、特定の列に一意のラベルがある場合や、データの意味を明確にするためにカスタムのインデックスを使用したい場合にも役立ちます。