我是机器学习的新手,并且通过Udacity介绍ML课程 . 在适当的时候,我对决策树和随机森林分类器有一些疑问 .
我的第一个疑问是决策树是唯一的吗?我认为它应该是唯一的,因为它最大化信息增益超过每个分割 . 现在如果它是唯一的,为什么在决策树分类器中有random_state参数 . 因为它是唯一的所以它是可重复的每次都没有 . 因为决策树是唯一的,所以不需要random_state .
第二个,在通过随机森林算法时,我读到它平均每个类的概率来自它的单个树,但据我所知,决策树预测类不是每个类的概率 .
请纠正我如果我错了清除我的怀疑 . 希望得到一些好的答案 .
1 回答
即使没有签出代码,您也会在文档中看到this note:
对于
splitter='best'
,这种情况正在发生here:而对于您的其他问题,请阅读this: