📚 什么是决策树?
决策树通过一系列 if-else 问题将数据分到不同叶子节点,每个叶子给出预测类别。就像医生问诊:「是否发烧?」→「是否咳嗽?」→ 诊断结果。
优点:可解释性强、无需特征缩放、可处理非线性。缺点:容易过拟合(需剪枝或限制深度)。
🎮 交互:「是否出去玩?」决策树
点击树节点查看分裂条件;选择下方样本,观察它如何被分类。
选择样本或点击节点…
📊 分裂准则简介
- 信息增益(ID3):选择使熵下降最多的特征
- 基尼指数(CART):$Gini = 1 - \sum p_k^2$,越小越纯
- 预剪枝 / 后剪枝:限制深度或合并叶子,防止过拟合