在插入符号包的训练函数中,可以执行预测变量的居中和缩放,如下例所示:
knnFit <- train(Direction ~ ., data = training, method = "knn",
preProcess = c("center","scale"))
在训练中设置此变换应该在重新采样期间更好地评估算法的性能 .
在这种情况下,当我使用模型来预测新数据的响应时,我应该关心居中和缩放还是这个操作包含在最终模型中?
以下操作是否足够?
pred <- predict(knnFit, newdata = test)
谢谢!
1 回答
列车对象中指定的preProces将应用于新数据,而无需先预处理新数据 . 所以你的操作就足够了 .
另请参阅下面的插入符号网站的摘录 . 还有一整个部分纯粹是关于预处理 . 绝对值得你花时间阅读它 .
你可以在这里找到caret website .