Pythonのpandasメソッド value_counts

2023年10月9日

pandasvalue_countsメソッドは、Series内のユニークな値の出現回数をカウントして、各値の頻度を取得するためのメソッドです。このメソッドは、カテゴリカルデータやカテゴリ別の集計を行う際に非常に便利です。

基本的な使い方は以下の通りです:

python
import pandas as pd

# サンプルのSeriesを作成する
data = ['A', 'B', 'A', 'C', 'B', 'A', 'A', 'B', 'C']
s = pd.Series(data)

# 各値の出現回数をカウントする
value_counts = s.value_counts()

# 結果を表示する
print(value_counts)

上記のコードでは、value_countsメソッドを使用してSeries s 内の各値の出現回数をカウントしています。結果として、各値とその出現回数が表示されます。

value_countsメソッドの主な特徴は以下です:

  • ユニークな値ごとの出現回数を返します。
  • デフォルトでは、出現回数が多い順にソートされます。
  • normalize引数をTrueに設定することで、相対的な頻度(割合)を取得できます。
  • Series内のNaN(欠損値)もカウントします。

value_countsメソッドは、カテゴリカルデータの優れた要約情報を提供し、データの特性を理解するのに役立ちます。特定のカテゴリの頻度や、データセット内の最も一般的な値を把握するのに便利です。