ジニ不純度

ジニ不純度(Gini impurity)は、決定木やランダムフォレストなどの機械学習モデルで使用される、分類タスクの不純度を評価する指標の一つです。ジニ不純度は、特定のノード内のクラスの混合具合を表します。

ジニ不純度は、次のように定義されます。

Gini(D)=1i=1kpi2Gini(D) = 1 – sum_{i=1}^{k} p_i^2

ここで、DD

ジニ不純度は、0から1の間の値を取り、0に近いほどノードが純粋であることを示し、1に近いほど不純度が高いことを示します。つまり、ジニ不純度が低いほど、そのノードはより一貫して特定のクラスに属するサンプルで構成されていることを意味します。

決定木やランダムフォレストでは、ノードの分割においてジニ不純度を最小化するような特徴量と閾値を選択することで、クラスの分離を最適化します。

未分類

Posted by ぼっち