Pythonのpandasメソッド unique

2023年10月9日

pandasuniqueメソッドは、Series(列)内の一意の値(重複を除いた値)を抽出するためのメソッドです。このメソッドを使用すると、特定の列内の一意の値を取得できます。これはデータのクリーニングやデータの重複を確認するために役立ちます。

基本的な使い方は以下の通りです:

python
import pandas as pd

# サンプルのSeriesを作成する
data = [1, 2, 2, 3, 3, 4, 4, 5]
s = pd.Series(data)

# Series内の一意の値を取得する
unique_values = s.unique()

# 結果を表示する
print(unique_values)

上記のコードでは、uniqueメソッドを使用してSeries s 内の一意の値を取得しています。結果として、一意の値の配列が unique_values 変数に格納されています。

uniqueメソッドの主な特徴は以下です:

  • 重複を削除し、一意の値の配列を返します。
  • 返される配列の順序は、元のデータの順序とは異なることがあります。
  • NaN(欠損値)も一意の値として扱われます。

uniqueメソッドは、データ内のユニークなカテゴリやラベルを取得したり、データ内の重複を確認したりするのに便利です。これは、データの前処理や集計、データ品質のチェックに使用できます。