🌳 决策树

像流程图一样做决策:可解释、易理解的分类算法

📚 什么是决策树?

决策树通过一系列 if-else 问题将数据分到不同叶子节点,每个叶子给出预测类别。就像医生问诊:「是否发烧?」→「是否咳嗽?」→ 诊断结果。

优点:可解释性强、无需特征缩放、可处理非线性。缺点:容易过拟合(需剪枝或限制深度)。

🎮 交互:「是否出去玩?」决策树

点击树节点查看分裂条件;选择下方样本,观察它如何被分类。

选择样本或点击节点…

📊 分裂准则简介

  • 信息增益(ID3):选择使熵下降最多的特征
  • 基尼指数(CART):$Gini = 1 - \sum p_k^2$,越小越纯
  • 预剪枝 / 后剪枝:限制深度或合并叶子,防止过拟合