Pandasのメソッド説明 concat

Pandasのconcat関数は、複数のデータフレーム(またはシリーズ)を結合して、新しいデータフレームを作成するための非常に便利なメソッドです。concatは、データの縦方向または横方向への結合が可能で、データの結合や連結を行う際に使用されます。

以下は、concat関数の基本的な使い方と主要なパラメータの説明です。

基本的な使用法(縦方向への結合):

python
import pandas as pd

# サンプルデータフレームを作成
data1 = {'A': [1, 2, 3], 'B': [4, 5, 6]}
data2 = {'A': [7, 8, 9], 'B': [10, 11, 12]}
df1 = pd.DataFrame(data1)
df2 = pd.DataFrame(data2)

# データフレームを縦方向に結合
concatenated_df = pd.concat([df1, df2])

# 結合されたデータフレームを表示
print(concatenated_df)

この例では、pd.concat関数を使用してdf1df2を縦方向に結合し、新しいデータフレームconcatenated_dfを作成しました。デフォルトでは、行が追加されます。

axisパラメータを使用した横方向への結合:

axisパラメータを設定して、データを横方向に結合することもできます。axis=1を指定すると、列が追加されます。

python
# データフレームを横方向に結合
concatenated_df_horizontal = pd.concat([df1, df2], axis=1)

# 横方向に結合されたデータフレームを表示
print(concatenated_df_horizontal)

ignore_indexパラメータ:

ignore_index=Trueを設定すると、結合後のデータフレームでインデックスがリセットされ、連続した整数になります。

python
# インデックスをリセットして縦方向に結合
concatenated_df_reset_index = pd.concat([df1, df2], ignore_index=True)

# インデックスがリセットされたデータフレームを表示
print(concatenated_df_reset_index)

pd.concatは、データの結合、連結、および結合軸の操作に非常に便利です。データを柔軟に操作し、異なるソースからのデータを効果的に結合するのに役立ちます。