Pythonのpandasメソッド isnull

2023年10月9日

pandasisnullメソッドは、DataFrameやSeries内で値が欠損している場所を特定するためのメソッドです。このメソッドを使用すると、各要素が欠損値(NaN)かどうかを真偽値で示す新しいデータフレームまたはシリーズを生成できます。

基本的な使い方は以下の通りです:

python
import pandas as pd
import numpy as np

# サンプルのSeriesを作成する(欠損値を含む)
data = [1, 2, np.nan, 4, np.nan, 6]
s = pd.Series(data)

# 欠損値の場所を特定する
is_null = s.isnull()

# 結果を表示する
print(is_null)

上記のコードでは、isnullメソッドを使用してSeries s 内の各要素が欠損値かどうかを示す真偽値のシリーズ is_null を生成しています。結果として、欠損値の場所がTrue、非欠損値の場所がFalseで表示されます。

isnullメソッドの主な特徴は以下です:

  • 欠損値の場所を特定するために、各要素をTrue(欠損値の場合)またはFalse(非欠損値の場合)としてマークします。
  • 欠損値の場所を特定するのに役立ち、データのクリーニングや処理に使用されます。
  • 逆の操作を行うために、notnullメソッドも使用できます。これは、欠損値でない場所を特定するために使用されます。

isnullメソッドは、データ内の欠損値を確認し、それに対処するために役立ちます。欠損値を取り扱う際には、このメソッドを使用してデータの品質を確認し、必要に応じて欠損値を処理することが重要です。