上文我们讨论了决策树的基本概念,并且利用信息熵和基尼系数两种方式来模拟决策树的划分。其实之前我们实现的决策树又叫 CART(Classification And Regression Tree)。本文我们就来讨论一下 CART 以及 CART 的一些常用的超参数。 阅读全文
作者: LouYu
机器学习算法笔记(二十九):决策树初探
决策树(Decision Tree)是一种非参数的监督学习算法,它能够从一系列有特征和标签的数据中总结出决策规则,并用树状图的结构来呈现这些规则,以解决分类和回归问题。下面我们就来简单讨论一下决策树的基本概念。 阅读全文
机器学习算法笔记(二十八):精准率的召回率的平衡、精准—召回率曲线与ROC曲线
上一篇文章我们提到在某些场景中我们更加看重精准率,某些场景我们更加看重召回率,而某些场景需要同时考虑这两者,希望这两者越大越好。其实同时追求精准率和召回率是不现实的,精准率和召回率是互相矛盾的,这时我们就要在两者间取得平衡。 阅读全文
机器学习算法笔记(二十七):混淆矩阵、精准率与召回率、F1 Score
对于回归问题来说,评论算法的好坏我们讨论过 MSE、MAE、RMSE、R Squared。但对于分类算法的评价,我们在前面始终使用“分类准确度”这一个指标。实际上分配准确度在评价分类算法的时候是存在问题的,这时我们就要引入混淆矩阵、精准率与召回率的概念。 阅读全文