Pandasのメソッド説明 drop

2023年10月9日

Pandasのdropメソッドは、データフレーム内の指定した行または列を削除するためのメソッドです。dropメソッドを使用すると、データフレームの一部を変更せずに、指定した行または列を除外できます。

以下は、dropメソッドの基本的な使い方と主要なパラメータの説明です。

行の削除:

python
import pandas as pd

# サンプルデータフレームを作成
data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'],
        'Math': [85, 90, 78, 92],
        'English': [70, 88, 95, 80]}
df = pd.DataFrame(data)

# 特定の行を削除
df_dropped = df.drop(1)  # インデックス1の行を削除

# 行が削除されたデータフレームを表示
print(df_dropped)

この例では、dropメソッドを使用して、インデックス1の行(’Bob’の行)を削除しました。

列の削除:

python
# 特定の列を削除
df_dropped_column = df.drop('Math', axis=1)  # 'Math'列を削除

# 列が削除されたデータフレームを表示
print(df_dropped_column)

この例では、dropメソッドを使用して、’Math’列を削除しました。axis=1パラメータを指定して列を削除することを示します。

複数の行または列の削除:

複数の行または列を削除する場合、リストまたは配列を使用して削除対象の行や列を指定できます。

python
# 複数の行を削除
df_dropped_rows = df.drop([0, 2])  # インデックス0と2の行を削除

# 複数の列を削除
df_dropped_columns = df.drop(['Math', 'English'], axis=1)  # 'Math'列と'English'列を削除

inplaceパラメータ:

inplace=Trueを設定すると、dropメソッドはデータフレームを変更し、新しいデータフレームを返しません。デフォルトではinplace=Falseです。

python
# インプレースで列を削除
df.drop('Math', axis=1, inplace=True)  # 'Math'列を削除してデータフレームを変更

dropメソッドは、データフレームから特定の行または列を削除するのに役立ちます。データの前処理や不要な情報の削除に使用され、データの整理に役立ちます。ただし、データフレームを変更しない場合は、新しい変数に削除後のデータフレームを割り当てることもできます。