Pythonのpandasメソッド sort_values

2023年10月9日

pandassort_valuesメソッドは、DataFrameまたはSeries内のデータを特定の列または複数の列を基準にしてソートするためのメソッドです。データを昇順または降順に並べ替えることができます。

基本的な使い方は以下の通りです:

python
import pandas as pd

# サンプルのDataFrameを作成する
data = {'名前': ['Alice', 'Bob', 'Charlie'],
        '年齢': [25, 30, 35]}

df = pd.DataFrame(data)

# '年齢'列を基準に昇順でソートする
df_sorted = df.sort_values(by='年齢')

# 結果を表示する
print(df_sorted)

上記のコードを実行すると、’年齢’列を基準に昇順でソートされたDataFrameが得られます:

markdown
       名前  年齢
0   Alice  25
1     Bob  30
2  Charlie  35

sort_valuesメソッドの主要な引数は以下です:

  • by: ソートの基準となる列または列のリストを指定します。
  • axis: ソート対象が行または列かを指定します。デフォルトは行方向(axis=0)です。
  • ascending: ソート順序を昇順(True)または降順(False)で指定します。デフォルトは昇順です。
  • inplace: ソートをインプレースで行うかどうかを指定します。デフォルトはFalseで、新しいDataFrameを返します。

複数の列を基準にソートしたい場合、by引数に複数の列名を含むリストを指定できます。また、ascending引数を使ってソート順序を設定することもできます。

python
# '年齢'列を昇順、'名前'列を降順にソートする例
df_sorted = df.sort_values(by=['年齢', '名前'], ascending=[True, False])

sort_valuesメソッドはデータフレームのソート操作に非常に便利であり、データの順序を変更してデータの解析や可視化を行う際に役立ちます。