Best Parameters: {‘colsample_bytree’: 0.6431565707973218, ‘learning_rate’: 0.019428755706020276, ‘max_depth’: 9, ‘n_estimators’: 340, ‘subsample’: 0.7257423924305306} Accuracy: 0.5543345543345544 Precision: 0.5215769114241183 Recall: 0.5543345543345544 F1 Score: 0.5190071834938049 ROC AUC Score: 0.8012548849572678 上記の結果が出た。 RF_ベースモデル_est100ベースモデル_est500商品名の除外メーカー品番をラベルエンコーディング追加商品名の記号置換商品名のラベルエンコーディング追加商品名のCountVectorizerの除外標準化XB_ベースモデル_est=1000XB_ランダムサーチ Accuracy:0.5628815630.560439560.4884004880.5677655680.5567765570.5714285710.5372405370.5677655680.5335775340.554334554 Precision:0.5315840.5277868790.4782995730.5402894350.5314114290.5392694230.5214282930.5402894350.5237452480.521576911 Recall:0.5628815630.560439560.4884004880.5677655680.5567765570.5714285710.5372405370.5677655680.5335775340.554334554 F10.5259812770.5214738420.481048240.5319235320.5225131660.5370858670.5254654420.5319235320.5251315840.519007183 ROC0.7550416090.7828641750.7191715240.7903844320.7616002680.7545344520.7385223670.7903920030.726494170.801254885
上記の結果を見ると、ランダムサーチを使用して見つかったハイパーパラメータの組み合わせによるXGBoostモデルの性能は、他のモデルと比較してどうなっているかを確認できます。
- ランダムサーチを使用したXGBoostモデルの精度(Accuracy)は 0.554 です。他のモデルと比較すると、いくつかのモデルよりも高い精度を示していますが、他のモデルには及びません。
- 適合率(Precision)も同様で、0.522 という値は他のモデルよりも高いものの、最も高い値ではありません。
- 再現率(Recall)も 0.554 であり、他のモデルと同様です。
- F1スコアは 0.519 であり、他のモデルと比較しても平均的な性能を示しています。
- ROC AUCスコアは 0.801 です。他のモデルと比較しても高い値を示していますが、一部のモデルには及びません。
この結果を見ると、ランダムサーチを使用して見つかったハイパーパラメータの組み合わせは、いくつかの指標で他のモデルを上回っていますが、全体的な性能としては平均的なものであると言えます。可能であれば、さらなるハイパーパラメータのチューニングや他の手法の検討が必要かもしれません。

ディスカッション
コメント一覧
まだ、コメントがありません