R - 基于多个字段（因子）进行预测，但不是整个数据帧-Java 学习之路

好的，我有一个数据框，包含对9个变量的250个观测值 . 为简单起见，我们只标记它们A - I.

我已经完成了所有标准的东西（将事物转换为int或factor，创建数据分区，测试和训练集等） .

我想要做的是使用A列和B列，并预测列E.我不想使用整个九列，只有这三列才能进行预测 .

我只尝试使用预测中的有限列，如下所示：

myPred <- predict(rfModel, newdata=myData)

其中rfModel是我的模型，myData只包含我想要使用的两个字段，作为数据帧 . 不幸的是，我收到以下错误：

predict.randomForest（rfModel，newdata = myData）中的错误：newdata中缺少训练数据中的变量

老实说，我对R很新，我甚至不确定这是否可行 . 我认为我正在收集的数据（九个字段）对于“训练”非常重要，但我无法弄清楚如何仅使用“结果”字段（在本例中为字段E）进行预测，另外两个字段（A和B），并保留其他重要数据 .

任何意见是极大的赞赏 . 如有必要，我可以发布一些代码 .

我只是想了解更多关于这样的事情 .

2 回答