Pythonのpandasメソッド pandas.merge

2023年10月9日

pandas.mergeメソッドは、pandasライブラリで提供されているデータフレームを結合するためのメソッドです。このメソッドを使用することで、複数のデータフレームを共通の列またはインデックスを基準に結合し、新しいデータフレームを作成できます。データベースのJOIN操作に似たような機能を提供します。

基本的な使い方は以下の通りです:

python
import pandas as pd

# サンプルのデータフレームを作成する
df1 = pd.DataFrame({'キー': ['A', 'B', 'C', 'D'],
                    '値1': [1, 2, 3, 4]})

df2 = pd.DataFrame({'キー': ['B', 'D', 'E', 'F'],
                    '値2': ['foo', 'bar', 'baz', 'qux']})

# データフレームを結合する
merged_df = pd.merge(df1, df2, on='キー', how='inner')

# 結果を表示する
print(merged_df)

上記のコードでは、2つのデータフレーム df1df2 をキー列 'キー' を基準に内部結合(how='inner')しています。結合されたデータフレーム merged_df が生成されます。

pandas.mergeメソッドの主要な引数は以下です:

  • left: 左側のデータフレーム。
  • right: 右側のデータフレーム。
  • on: 結合の基準となる列名(または列名のリスト)。データフレームどうしで共通している列を指定します。
  • how: 結合の種類を指定します。inner(内部結合)、left(左外部結合)、right(右外部結合)、またはouter(外部結合)を指定できます。
  • left_onおよびright_on: 左側と右側のデータフレームで異なる列名を持つ場合に、それぞれのデータフレームの結合キーを指定できます。
  • left_indexおよびright_index: インデックスを結合キーとして使用する場合にTrueに設定します。

pandas.mergeメソッドを使用することで、異なるデータフレームのデータを結合して新しいデータフレームを生成し、データの結合と結合方法を制御できます。データの統合やデータベーススタイルの操作に便利です。