我正在努力评估我的随机森林的表现 - 我看过平均相对误差,但我不确定它是否是一个很好的指标 . 有什么需要检查的东西?
另外,我应该如何优化我的超参数?我使用了 rf.score(X_test,y_test)
R2,但在回归时我真的应该依赖它吗?我看了一下袋子的分数,但我不确定如何解释它们 .
祝你的最佳选择是全局的,你的超参数优化:)
from sklearn.ensemble import RandomForestRegressor
rf = RandomForestRegressor(n_estimators = 1000,max_depth=5,random_state = 0)
rf.fit(X_train, y_train);
predictions = rf.predict(X_test)
errors = abs((predictions - y_test)/y_test)
print('Mean Relative Error:', round(np.mean(errors), 2))
1 回答
您还可以添加以下两个指标:
accuracy_score(my_class_column,my_forest_train_prediction)confusion_matrix(my_test_data,my_prediction_test_forest)
此外,还可以添加每个预测的概率: