Pandasのメソッド説明 set_index

Pandasのset_indexメソッドは、データフレーム内の特定の列を新しい行のインデックス(ラベル)として設定するためのメソッドです。このメソッドを使用することで、行のインデックスをデータの特定の属性に関連付けることができます。以下は、set_indexメソッドの一般的な使い方と主要なパラメータの説明です。

python
import pandas as pd

# サンプルデータフレームを作成
data = {'ID': [101, 102, 103],
        'Name': ['Alice', 'Bob', 'Charlie'],
        'Age': [25, 30, 35]}
df = pd.DataFrame(data)

# 'ID'列を新しいインデックスに設定
df.set_index('ID', inplace=True)

# 主要なパラメータ:
# - 'keys': インデックスに設定したい列名または列のリストを指定します。
# - 'inplace': デフォルトではFalseで、新しいデータフレームを作成します。Trueに設定すると、元のデータフレームを直接変更します。

# インデックスが設定されたデータフレームを表示
print(df)

上記の例では、’ID’列を新しい行のインデックスに設定しました。set_indexメソッドを使用することで、行のラベルが通常の整数インデックスから’ID’列の値に変更されます。

このメソッドは、特定の列に基づいてデータフレームをフィルタリング、結合、グループ化、操作する際に役立ちます。データのクエリや分析の際に、インデックスを適切に設定することは非常に重要です。また、reset_indexメソッドを使用してインデックスを元に戻すこともできます。