Pandasのメソッド説明 head,tail,sample

Pandasのheadtail、およびsampleメソッドは、データフレームやシリーズの最初や最後の行を表示したり、ランダムにサンプリングしたりするためのメソッドです。これらのメソッドは、データを視覚化したり、データの概要を確認したりする際に便利です。

headメソッド:
headメソッドは、データフレームやシリーズの先頭から指定した数の行を取得します。デフォルトでは、最初の5行を取得しますが、引数を指定して取得する行数を変更できます。

python
import pandas as pd

# サンプルデータフレームを作成
data = {'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Eva'],
        'Age': [25, 30, 35, 28, 22]}
df = pd.DataFrame(data)

# データフレームの先頭から3行を表示
print(df.head(3))

tailメソッド:
tailメソッドは、データフレームやシリーズの末尾から指定した数の行を取得します。デフォルトでは、最後の5行を取得しますが、引数を指定して取得する行数を変更できます。

python
# データフレームの末尾から2行を表示
print(df.tail(2))

sampleメソッド:
sampleメソッドは、データフレームやシリーズからランダムに行をサンプリングします。デフォルトでは、1行をランダムに選択しますが、引数を指定してサンプリングする行数を変更できます。また、random_stateパラメータを指定してランダムシードを設定することもできます。

python
# データフレームからランダムに2行をサンプリング
print(df.sample(2))

# ランダムシードを設定して再現性を確保
print(df.sample(2, random_state=42))

これらのメソッドを使用することで、データの先頭や末尾の一部を表示し、データの概要を把握したり、ランダムなデータのサンプルを取得したりするのに役立ちます。データの検査や可視化、サンプリングなどのデータ操作に使用されます。