Pandasのメソッド説明 fillna

Pandasのfillnaメソッドは、データフレーム内の欠損値(NaNまたはNone)を指定した値や方法で置き換えるためのメソッドです。欠損値は、データセット内の情報が不完全な場合や分析の際に問題を引き起こす場合に特に重要です。fillnaメソッドを使用することで、欠損値を適切な値で埋めることができます。以下は、DataFrame.fillnaメソッドの一般的な使い方と主要なパラメータの説明です。

欠損値を指定の値で置き換える:

python
import pandas as pd
import numpy as np

# サンプルデータフレームを作成(欠損値を含む)
data = {'A': [1, 2, np.nan, 4],
        'B': [np.nan, 6, 7, 8]}
df = pd.DataFrame(data)

# 欠損値を特定の値(例: 0)で置き換える
df_filled = df.fillna(0)

# 欠損値が置き換えられた新しいデータフレームを表示
print("DataFrame with NaN replaced by 0:")
print(df_filled)

この例では、fillnaメソッドを使用して、データフレームdf内の欠損値を値0で置き換えています。

欠損値を前の値や次の値で置き換える:

python
# 欠損値を前の値で置き換える(前方埋め)
df_forward_fill = df.fillna(method='ffill')

# 欠損値を次の値で置き換える(後方埋め)
df_backward_fill = df.fillna(method='bfill')

# 前方埋めと後方埋めの結果を表示
print("Forward Fill (ffill):")
print(df_forward_fill)
print("nBackward Fill (bfill):")
print(df_backward_fill)

この例では、fillnaメソッドを使用して、欠損値を前の値(前方埋め)または次の値(後方埋め)で置き換えています。これは、時系列データなどの特定のシナリオで有用です。

fillnaメソッドは、欠損値を指定の値や方法で置き換えるための柔軟なツールです。データの欠損値を適切に処理することは、データ分析や機械学習モデリングの前提条件の1つです。