首页 文章

随机森林回归 - 我如何分析其表现? - 蟒蛇,sklearn

提问于
浏览
0

我正在努力评估我的随机森林的表现 - 我看过平均相对误差,但我不确定它是否是一个很好的指标 . 有什么需要检查的东西?

另外,我应该如何优化我的超参数?我使用了 rf.score(X_test,y_test) R2,但在回归时我真的应该依赖它吗?我看了一下袋子的分数,但我不确定如何解释它们 .

祝你的最佳选择是全局的,你的超参数优化:)

from sklearn.ensemble import RandomForestRegressor

rf = RandomForestRegressor(n_estimators = 1000,max_depth=5,random_state = 0)
rf.fit(X_train, y_train);

predictions = rf.predict(X_test)


errors = abs((predictions - y_test)/y_test)
print('Mean Relative Error:', round(np.mean(errors), 2))

1 回答

  • 0

    您还可以添加以下两个指标:

    from sklearn.metrics import accuracy_score, confusion_matrix
    

    accuracy_score(my_class_column,my_forest_train_prediction)confusion_matrix(my_test_data,my_prediction_test_forest)

    此外,还可以添加每个预测的概率:

    my_classifier_forest.predict_proba(variable 1, variable n)
    

相关问题