Pythonのpandasメソッド nunique

2023年10月9日

pandasnuniqueメソッドは、DataFrameやSeries内で一意の値(重複を除いた値)の数をカウントするためのメソッドです。このメソッドを使用することで、データ内のユニークな要素の数を取得できます。

基本的な使い方は以下の通りです:

python
import pandas as pd

# サンプルのSeriesを作成する
data = ['A', 'B', 'A', 'C', 'B', 'A', 'A', 'B', 'C']
s = pd.Series(data)

# ユニークな要素の数をカウントする
unique_count = s.nunique()

# 結果を表示する
print(unique_count)

上記のコードでは、nuniqueメソッドを使用してSeries s 内のユニークな要素の数をカウントしています。結果として、ユニークな要素の数(この場合は3)が表示されます。

nuniqueメソッドの主な特徴は以下です:

  • ユニークな要素の数をカウントします。
  • デフォルトでは、NaN(欠損値)はカウントされません。欠損値を含めるには、dropna=Falseを引数として渡します。
  • SeriesやDataFrame内の列ごとにユニークな要素の数をカウントできます。

nuniqueメソッドは、データ内のカテゴリカルな要素の数を確認し、データの品質や特性を理解するのに役立ちます。特に、カテゴリカルデータの列の数を把握するのに便利です。