我正在使用scikit-learn库(python 3.x)的RandomForestRegressor类,我知道在决策树中测量分割质量的函数是方差减少(mse) . 鉴于RandomForestRegressor类支持多个输出,我的问题是:在这个特定类中多个输出的情况下,如何计算拆分的质量?
通过读取定义分裂标准的类的源代码,我会说树中分裂的杂质减少被计算为所有输出变量的平均杂质减少 . 因此,在给定多个输出的情况下,仅构建一个模型 . 这是scikit中默认的方式 - 学习RandomForestRegressor类吗?我希望有人可以和我一起看看我不完全确定我的陈述是否正确!
提前谢谢了!
1 回答
相应的scikit-learn课程(Gilles Louppe)的作者之一非常友好地回答了我的问题:上述理解是正确的 . 在每个类别上计算方差的减少,然后平均以产生最终分数 .