monthly_quantity20万行位なのに、800万行もある、なんで?

2024年6月17日

おそらく、マージ時にデータが複製されている可能性があります。これは、monthly_quantitydf の間で複数の一致する行が存在するために発生する可能性があります。

この問題を解決するには、monthly_quantitydf の間で一意の結合キーを使用する必要があります。現在のコードでは 自社品番 を結合キーとして使用していますが、それでも重複する行が発生しているようです。

まず、重複している行を特定し、それらがどのようにして複製されたのかを調査することが重要です。たとえば、df["自社品番"].value_counts() を使用して df自社品番 列の値の出現頻度を確認することができます。そして、その後、複製を防ぐために適切な結合方法を見つける必要があります。

もう一つの可能性は、monthly_quantity または df の中に重複する値が含まれていることです。重複する行が存在する場合は、drop_duplicates() メソッドを使用してそれらを削除できます。

未分類

Posted by ぼっち