Pythonのpandasメソッド fillna

2023年10月9日

pandasfillnaメソッドは、欠損値(NaN)を特定の値や方法で置き換えるためのメソッドです。欠損値はデータ内の不完全な情報を表しますが、fillnaメソッドを使用することで、これらの欠損値を適切な値で埋めることができます。

以下は、fillnaメソッドの基本的な使い方です:

python
import pandas as pd
import numpy as np

# サンプルのDataFrameを作成する
data = {'A': [1, 2, np.nan, 4, 5],
        'B': [np.nan, 2, 3, np.nan, 5]}

df = pd.DataFrame(data)

# 欠損値を特定の値で置き換える
df_filled = df.fillna(0)

# 結果を表示する
print(df_filled)

上記のコードでは、fillnaメソッドを使用して、DataFrame df 内の欠損値(NaN)を0で置き換えています。結果として、欠損値が0で埋められた新しいDataFrame df_filled が生成されます。

fillnaメソッドの主な特徴は以下です:

  • 第1引数に置き換える値を指定します。この値はスカラー値、辞書、Series、またはDataFrameとすることができます。
  • method引数を使用して、欠損値を前の値や後の値で置き換えることもできます。
  • inplace引数を使用して、元のDataFrameを変更するかどうかを指定できます。

fillnaメソッドは、データの前処理やデータのクリーニングの際に、欠損値を適切に処理するのに役立ちます。欠損値を適切に埋めることで、データの品質を維持し、分析やモデリングの精度を向上させることができます。