我在R studio中使用Caret包 . 我想在我的数据集上运行10-fold CV以执行线性回归分析 . 我适合模型如下:
train_control <- trainControl(method="cv", number=10)
output <- train(Species~., data=iris, trControl=train_control, method="lm")
上面的代码只给出了10倍以上的所有RMSE或Rsquared分数 .
output$resample
上面的代码给了我不同折叠的测试分数,这很好 .
Q1:现在我的问题是我怎样才能在这些不同的折叠上同样找到训练分数?
Q2:以下命令给出了什么?在所有的折叠中,它是否超过所有测试分数?
getTrainPerf(output)
Q3:我如何估算每个折叠的截距和重量?而且,下面的代码只给了我所有折叠的总体截距和权重 . 这怎么算?是否只是在所有折叠中再次平均?
output$finalModel