我正在使用sciki-learn RandomForestRegressor来解决参数回归问题
random_state = 1,n_estimators = 100,max_features ='log2',min_impurity_decrease = 1e-3
类似地,我使用weka randomforest来获得与以下参数相同的回归问题
BagsizePercent = 100,maxDepth = 0,numFeatures = 0,numIterations = 100,seed = 1
据我了解,n_estimators = numIterations,random_state = seed和其他weka参数值与默认的scikit-learn值相同 .
但是我用scikit-learn(非常低于weka)得到了较差的结果 . 当我设置 max_features = 'auto'
对应于 numFeatures = 0
时,我的结果变得更糟 .
我想,降级可能是因为测试的随机分裂 . 所以我修改了如下,在weka中,我选择了
百分比分割= 50%
并设定
XVal /%Split = 1的随机种子并取消选中保留订单以进行%拆分
(使用已检查的Preserve Order for%split,我可以获得更好的Weka结果) .
同样,在我的scikit-learn代码中,我设置了
train_test_split(X,y,test_size = 0.5,random_state = 1,shuffle = False);
但我的结果仍然非常糟糕 .
有什么不对?