首页 文章

如果使用Scikit-Learn库的RandomForestRegressor我们有多个输出,计算分裂的杂质是如何减少的?

提问于
浏览
0

我正在使用scikit-learn库(python 3.x)的RandomForestRegressor类,我知道在决策树中测量分割质量的函数是方差减少(mse) . 鉴于RandomForestRegressor类支持多个输出,我的问题是:在这个特定类中多个输出的情况下,如何计算拆分的质量?

通过读取定义分裂标准的类的源代码,我会说树中分裂的杂质减少被计算为所有输出变量的平均杂质减少 . 因此,在给定多个输出的情况下,仅构建一个模型 . 这是scikit中默认的方式 - 学习RandomForestRegressor类吗?我希望有人可以和我一起看看我不完全确定我的陈述是否正确!

提前谢谢了!

https://github.com/scikit-learn/scikit-learn/blob/a24c8b464d094d2c468a16ea9f8bf8d42d949f84/sklearn/tree/_criterion.pyx#L695

1 回答

  • 1

    相应的scikit-learn课程(Gilles Louppe)的作者之一非常友好地回答了我的问题:上述理解是正确的 . 在每个类别上计算方差的减少,然后平均以产生最终分数 .

相关问题