相関関係は、ターゲットとの関係性の有無だけをみておけばいい?
相関関係を確認する際には、主に以下の2つの関係性を考慮する必要があります。
-
特徴量間の相関関係:特徴量同士の相関を確認して、互いに類似した情報を持つ特徴量がないかどうかを評価します。相関の高い特徴量が複数ある場合、その中から適切な特徴量を選択するか、特徴量を組み合わせて新しい特徴量を作成することで、モデルの複雑さを減らし、性能を向上させることができます。
-
ターゲットとの相関関係:特徴量とターゲット変数との相関を確認して、ターゲットを予測する上で重要な情報を持つ特徴量がどれかを特定します。ターゲットとの相関が高い特徴量は、モデルの予測性能に寄与する可能性が高いため、モデルの学習に役立ちます。
したがって、特徴量エンジニアリングを行う際には、特徴量間の相関関係だけでなく、特徴量とターゲットとの相関関係も考慮する必要があります。特に、モデルの性能向上を目指す場合には、ターゲットとの相関が高い特徴量を重点的に選択または作成することが重要です。

ディスカッション
コメント一覧
まだ、コメントがありません