決定木の不純度の指標
決定木の不純度を評価するための主な指標には、ジニ不純度(Gini impurity)、エントロピー(Entropy)、および分類誤差(Classification error)があります。
-
ジニ不純度(Gini impurity):
- ジニ不純度は、分割したノード内のクラスの不純度を測定する指標です。
- ジニ不純度が高いほど、ノード内のクラスが均等に混合されていることを示し、分割が不安定であることを示します。
- ジニ不純度は、以下の式で計算されます。
- ここで、
-
エントロピー(Entropy):
- エントロピーは、情報理論からの概念であり、分割したノード内のクラスの混合度を測定する指標です。
- エントロピーが高いほど、ノード内のクラスが均等に混合されていることを示し、分割が不安定であることを示します。
- エントロピーは、以下の式で計算されます。
- ここで、
-
分類誤差(Classification error):
- 分類誤差は、分割したノード内のクラスの中で最も多数派のクラスの割合を表します。
- 分類誤差が高いほど、ノード内のクラスが均等に混合されていることを示し、分割が不安定であることを示します。
- 分類誤差は、以下の式で計算されます。
- ここで、
これらの指標は、決定木の分割基準として使用され、特定のノードの不純度を評価して最適な分割を見つけるのに役立ちます。

ディスカッション
コメント一覧
まだ、コメントがありません