首页 文章

Python Scikit学习 - 不要使用train_test_split进行随机拆分

提问于
浏览
0

我使用Scikit学习train_test_split和随机森林进行建模 . 我已经在train_test_split的random_state中设置了固定数字,比如random_state = 1,但每次运行时仍然会生成不同的结果 . 我想要一个固定的结果来比较模型 . 非常感谢 .

1 回答

  • 0

    “不同的结果”是什么意思?我建议在将训练/测试集传递给训练代码之前,先打印一下培训/测试集的简短预览 . 例如:

    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.25 random_state = 1)
    print(X_train[:10])
    

    我可以确认此代码将在多次运行中生成相同的X_train集 .

    但是,如果“不同结果”表示训练错误不同,您可能还需要确保修复随机森林分类器的随机种子 .

相关问题