Weighted Accuracy: 0.5616605616605617 Weighted Precision: 0.5318493541919603 Weighted Recall: 0.5616605616605617 Weighted F1 Score: 0.5216993753351751 Weighted ROC AUC Score: 0.7692266112375148 不均衡が未だ発生している。AUCが高い

AUCが高いが、他の指標(Accuracy、Precision、Recall、F1 Score)が低いということは、モデルが陽性クラスに対する予測性能が高い一方で、陰性クラスに対する予測性能が低い可能性があります。これは、データのクラスの不均衡に起因するものです。

このような場合、以下のアプローチが考えられます:

  1. データのバランスをとる: 不均衡データに対処するために、少数クラスのサンプル数を増やすオーバーサンプリングまたは多数クラスのサンプル数を減らすアンダーサンプリングを行います。
  2. 重み付け: 不均衡なクラスに対して重みを付けることで、モデルが不均衡なデータに適切に対処できるようにします。
  3. 異常検出アルゴリズムの使用: データの異常な部分を検出するための異常検出アルゴリズムを使用することができます。
  4. 特徴量エンジニアリング: 有効な特徴量の選択や新しい特徴量の作成を行うことで、モデルの性能を向上させることができます。

オーバーサンプリングまたはアンダーサンプリングを使用する場合、imbalanced-learnパッケージを使用すると便利です。また、重み付けの代わりに異常検出アルゴリズムを使用することもできます。

具体的なアプローチは、データセットの特性やビジネスのニーズによって異なりますので、適切なアプローチを選択してください。

未分類

Posted by ぼっち