首页 文章

是否有必要在预测之前对数据进行居中和缩放?

提问于
浏览
5

在插入符号包的训练函数中,可以执行预测变量的居中和缩放,如下例所示:

knnFit <- train(Direction ~ ., data = training, method = "knn",
                preProcess = c("center","scale"))

在训练中设置此变换应该在重新采样期间更好地评估算法的性能 .

在这种情况下,当我使用模型来预测新数据的响应时,我应该关心居中和缩放还是这个操作包含在最终模型中?

以下操作是否足够?

pred <- predict(knnFit, newdata = test)

谢谢!

1 回答

  • 4

    列车对象中指定的preProces将应用于新数据,而无需先预处理新数据 . 所以你的操作就足够了 .

    另请参阅下面的插入符号网站的摘录 . 还有一整个部分纯粹是关于预处理 . 绝对值得你花时间阅读它 .

    你可以在这里找到caret website .

    这些处理步骤将在使用predict.train,extractPrediction或extractProbs生成的任何预测期间应用(请参阅本文档后面的详细信息) . 预处理不会应用于直接使用对象$ finalModel对象的预测 .

相关问题