Pythonのpandasメソッド value_counts
pandasのvalue_countsメソッドは、Series内のユニークな値の出現回数をカウントして、各値の頻度を取得するためのメソッドです。このメソッドは、カテゴリカルデータやカテゴリ別の集計を行う際に非常に便利です。
基本的な使い方は以下の通りです:
python import pandas as pd # サンプルのSeriesを作成する data = ['A', 'B', 'A', 'C', 'B', 'A', 'A', 'B', 'C'] s = pd.Series(data) # 各値の出現回数をカウントする value_counts = s.value_counts() # 結果を表示する print(value_counts)
上記のコードでは、value_countsメソッドを使用してSeries s 内の各値の出現回数をカウントしています。結果として、各値とその出現回数が表示されます。
value_countsメソッドの主な特徴は以下です:
- ユニークな値ごとの出現回数を返します。
- デフォルトでは、出現回数が多い順にソートされます。
normalize引数をTrueに設定することで、相対的な頻度(割合)を取得できます。- Series内のNaN(欠損値)もカウントします。
value_countsメソッドは、カテゴリカルデータの優れた要約情報を提供し、データの特性を理解するのに役立ちます。特定のカテゴリの頻度や、データセット内の最も一般的な値を把握するのに便利です。

ディスカッション
コメント一覧
まだ、コメントがありません