ランダムフォレストでベースモデル作ったんだけど、例えば、ランダムフォレストで良い数値がでれば、ブースティング系でも良い数値がでる?(特徴量エンジニアリングの部分において)

ランダムフォレストとブースティング系のアルゴリズムは、それぞれ異なるアプローチを取っていますが、共通して特徴量エンジニアリングの影響を受けます。

良い結果が得られたランダムフォレストモデルは、ブースティングアルゴリズムでも同様に良い結果が得られる可能性があります。なぜなら、ランダムフォレストは複数の決定木のアンサンブルであり、ブースティングも複数の弱学習器のアンサンブルであるため、両者は似たようなデータのパターンをキャプチャすることができます。

ただし、ランダムフォレストとブースティングは異なるメカニズムを持っているため、特定のデータセットに対してどちらが適しているかは異なる場合があります。したがって、良い結果が得られたランダムフォレストモデルがある場合でも、ブースティングアルゴリズムを試す価値があるかどうかは、具体的な問題に依存します。

一般的には、両方のアルゴリズムを試してみて、性能がより良い方を選択することが良いアプローチです。

未分類

Posted by ぼっち