R中的Caret和KNN：预测函数给出错误-Java 学习之路

我尝试使用R中的插入符号包使用简化的KNN模型进行预测 . 它总是给出相同的错误，即使在这里非常简单的可重现示例中：

library(caret)
set.seed(1)

#generate training dataset "a" 
n = 10000
a = matrix(rnorm(n*8,sd=1000000),nrow = n)
y = round(runif(n))
a = cbind(y,a)
a = as.data.frame(a)
a[,1] = as.factor(a[,1])
colnames(a) = c("y",paste0("V",1:8))

#estimate simple KNN model
ctrl <- trainControl(method="none",repeats = 1)
knnFit <- train(y ~ ., data = a, method = "knn", trControl = ctrl, preProcess = c("center","scale"),  tuneGrid = data.frame(k = 10))

#predict on the training dataset (=useless, but should work)
knnPredict <- predict(knnFit,newdata = a,  type="prob")

这给了

[.data.frame 中的错误（out，，obsLevels，drop = FALSE）：选择了未定义的列

在没有目标变量y的情况下定义更真实的测试数据集“b”...

#generate test dataset
b =  matrix(rnorm(n*8,sd=1000000),nrow = n) 
b = as.data.frame(b)
colnames(b) = c(paste0("V",1:8))

#predict on the test datase
knnPredict <- predict(knnFit,newdata = b,  type="prob")

给出了同样的错误

[.data.frame 中的错误（out，，obsLevels，drop = FALSE）：选择了未定义的列

我知道列名是重要的，但在这里他们是相同的 . 这有什么不对？谢谢！

1 回答

1
问题是你的y变量 . 当您要求类概率时，列车和/或预测函数将它们放入一个数据框中，每个类都有一列 . 如果因子级别不是有效的变量名称，则会自动更改它们（例如"0"变为"X0"） . 另见post .

如果您在代码中更改此行，它应该工作：
```
a[,1] = factor(a[,1], labels = c("no", "yes"))
```
回复于 2024-05-08T09:54:15+08:00

R中的Caret和KNN：预测函数给出错误

1 回答

相关问题