我使用Scikit学习train_test_split和随机森林进行建模 . 我已经在train_test_split的random_state中设置了固定数字,比如random_state = 1,但每次运行时仍然会生成不同的结果 . 我想要一个固定的结果来比较模型 . 非常感谢 .
“不同的结果”是什么意思?我建议在将训练/测试集传递给训练代码之前,先打印一下培训/测试集的简短预览 . 例如:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.25 random_state = 1) print(X_train[:10])
我可以确认此代码将在多次运行中生成相同的X_train集 .
但是,如果“不同结果”表示训练错误不同,您可能还需要确保修复随机森林分类器的随机种子 .
1 回答
“不同的结果”是什么意思?我建议在将训练/测试集传递给训练代码之前,先打印一下培训/测试集的简短预览 . 例如:
我可以确认此代码将在多次运行中生成相同的X_train集 .
但是,如果“不同结果”表示训练错误不同,您可能还需要确保修复随机森林分类器的随机种子 .