要は、テストとしてランダムフォレストで試してみて、その後に、ブースティング系で処理する方がいいのかな
はい、そのようなアプローチは一般的に良い戦略です。ランダムフォレストは、比較的計算コストが低く、過学習に対する頑健性があるため、最初にモデルを構築してデータに適合させるのに適しています。また、ランダムフォレストは特徴量の重要度を推定しやすいため、データの特性や特徴量の理解を深めるのに役立ちます。
その後、ランダムフォレストでの初期モデルの構築と評価を行った後、ブースティング系のアルゴリズム(例えば、XGBoost、LightGBM、CatBoostなど)を使用してモデルのパフォーマンスをさらに向上させることができます。ブースティング系のアルゴリズムは、ランダムフォレストよりも複雑であり、より高度な特徴量の関係性をキャプチャできるため、さらなるパフォーマンスの向上が期待できます。
このようなアプローチにより、まずはランダムフォレストを使用してベースラインモデルを構築し、その後にブースティング系のアルゴリズムを適用してモデルの精度を向上させることができます。このプロセスは、データサイエンティストや機械学習エンジニアの間で一般的に採用されています。

ディスカッション
コメント一覧
まだ、コメントがありません