Pandasのメソッド説明 pandas.melt

Pandasのpandas.melt関数は、ワイド形式(Wide Format)のデータフレームをロング形式(Long Format)に変換するための関数です。ワイド形式のデータフレームでは、列が変数を表し、行が観測値を表しますが、ロング形式のデータフレームでは、変数名と値の列が含まれ、各行が単一の観測値を表します。この変換は、データの可視化や解析に適した形式にデータを整理するのに役立ちます。

以下は、pandas.melt関数の一般的な使い方と主要なパラメータの説明です。

基本的な使用法:

python
import pandas as pd

# サンプルデータフレームを作成
data = {'Name': ['Alice', 'Bob', 'Charlie'],
        'Math': [85, 90, 78],
        'English': [70, 88, 95]}
df = pd.DataFrame(data)

# データフレームをワイド形式からロング形式に変換
melted_df = pd.melt(df, id_vars=['Name'], var_name='Subject', value_name='Score')

# ロング形式のデータフレームを表示
print(melted_df)

この例では、pandas.melt関数を使用して、元のワイド形式のデータフレームdfをロング形式に変換しています。id_varsパラメータには、変換中に固定される列(ここでは’Name’列)を指定し、var_nameパラメータとvalue_nameパラメータには、新しい変数名と値の列の名前を指定します。

id_varsパラメータ:

id_varsパラメータは、ロング形式に変換する際に固定される列を指定するために使用します。これらの列は、変換後のデータフレームにそのまま残ります。

var_nameパラメータとvalue_nameパラメータ:

var_nameパラメータは、変数名(変数のカテゴリ名)の新しい列名を指定し、value_nameパラメータは値の新しい列名を指定します。

pandas.melt関数は、データの再形成や可視化のためにデータを整理する際に非常に便利です。特に、データフレーム内の多くの列を単一の変数として扱う必要がある場合や、可視化ライブラリ(例:SeabornやPlotly)にデータを適切に渡す必要がある場合に使用されます。