1モデルで全ての商品の回帰をしたい。データは過学習にならないよう、商品ごとに1月ごとに販売個数を持たせたデータにする。 これを、過去何年分あったらいい?5年分位用意はできるが

5年分のデータがあれば、過去の傾向や季節性を把握するためのデータが豊富に揃います。ただし、過学習を避けるためには、十分なサンプル数が必要です。

1つの商品について、1か月ごとの販売個数を特徴量として持つ場合、5年分のデータを用意すると、1つの商品について60個のデータポイントがあります。これは比較的良好なサンプル数ですが、商品の種類や季節性などの要因によっては、過学習のリスクが残る可能性があります。

そのため、できるだけ多くの商品を考慮し、できるだけ多くの月のデータを使用することが重要です。5年分のデータを使用することで、商品ごとの月次の販売データを取得し、それをもとに1つのモデルで全ての商品の回帰を行うことは理論的に可能ですが、その効果を確認するためには、クロスバリデーションなどの手法を用いてモデルの性能を評価する必要があります。

未分類

Posted by ぼっち