在训练我的模型时,当我使用像 sklearn.model_selection.train_test_split(X, y, stratify=y, train_size=0.9) 与 sklearn.model_selection.StratifiedKFold(n_splits=10) 这样的东西时,我得到了非常不同的结果,并且想知道他们如何对数据进行分层之间存在差异 . 我几乎可以肯定我根据文档实现了所有内容,但奇怪的是,后者的测试精度比第一次要差 .
sklearn.model_selection.train_test_split(X, y, stratify=y, train_size=0.9)
sklearn.model_selection.StratifiedKFold(n_splits=10)
当 stratify 不是None时 train_test_split 在内部使用StratifiedShuffleSplit,而不是StratifiedKFold . 所以,是的,有很大的不同 .
stratify
train_test_split
1 回答
当
stratify
不是None时train_test_split
在内部使用StratifiedShuffleSplit,而不是StratifiedKFold . 所以,是的,有很大的不同 .