dataframeでenumerateするのと、df.iterrows()は同じインデックスを取得する？

2024年6月8日

enumerate()とdf.iterrows()は似ていますが、いくつかの重要な違いがあります。

インデックスの取得方法:
- enumerate()を使用すると、インデックスと値のペアがタプルとして返されます。
- df.iterrows()を使用すると、インデックスと行のデータを含むSeriesが返されます。
返される値の型:
- enumerate()は、イテラブルの各要素に対してインデックスとその値のペアを返すため、返される値はタプルです。
- df.iterrows()は、DataFrameの各行に対してインデックスと行のデータを含むSeriesを返すため、返される値はSeriesです。
使用方法:
- enumerate()は、任意のイテラブル（リスト、タプル、文字列など）に対して使用できます。
- df.iterrows()は、DataFrameに対してのみ使用できます。
パフォーマンス:
- enumerate()はイテラブル全体をメモリにロードする必要がないため、メモリの使用量が少なく、大規模なデータセットにも適しています。
- df.iterrows()は、DataFrame全体がメモリにロードされるため、大規模なデータセットには適していません。

したがって、enumerate()は一般的にはシンプルで効率的な方法ですが、DataFrameの特定の行に対して操作を行う場合にはdf.iterrows()を使用することが一般的です。

Posted by ぼっち