Pythonのpandasメソッド count

2023年10月9日

pandascountメソッドは、DataFrameやSeries内で非欠損値(NaNでない値)の数をカウントするためのメソッドです。このメソッドを使用すると、データ内の欠損値を除外してデータの有効な要素の数を数えることができます。

基本的な使い方は以下の通りです:

python
import pandas as pd
import numpy as np

# サンプルのSeriesを作成する(欠損値を含む)
data = [1, 2, np.nan, 4, np.nan, 6]
s = pd.Series(data)

# 非欠損値の数をカウントする
count = s.count()

# 結果を表示する
print(count)

上記のコードでは、countメソッドを使用してSeries s 内の非欠損値の数をカウントしています。結果として、非欠損値の数(この場合は4)が表示されます。

countメソッドの主な特徴は以下です:

  • 欠損値(NaN)を除外して非欠損値の数をカウントします。
  • データフレームの場合、各列ごとに非欠損値の数をカウントします。
  • 非欠損値の数をカウントすることで、データのクリーニングや要約統計量の計算に役立ちます。

countメソッドは、データ内の有効なデータポイントの数を把握するのに役立ちます。データの品質を確認し、データの前処理を行う際に使用されます。