首页 文章

我可以在线性回归模型中应用交叉验证吗?

提问于
浏览
1

我有一个共有58个样本的数据集 . 数据集有两列“测量信号”和“people_in_area” . 因此,我正在尝试使用Scikit-learn训练线性回归模型 . 目前,我将75%的数据集用于培训,25%用于测试 . 但是,根据分割前数据的顺序,我获得不同的R平方值 .

我认为,由于数据集很小,取决于数据在拆分之前的顺序,不同的值将保持为x_test和y_test . 因此,我正在考虑在我的线性回归模型上使用“交叉验证”将测试和训练数据随机分成几次,训练更多,并且还能够测试更多,以这种方式获得更可靠的结果 . 这是正确的方法吗?

1 回答

  • 1

    是的,使用交叉验证可以更好地估算您的模型性能 .

    然而,随机拆分(交叉验证)将不适用于时间序列和/或所有数据分布 .

    “最终模型”不仅仅是您对模型性能的估计 .

相关问题