我的火车模型包含8523个数据和15个变量 .
session info [11] pkgconfig_2.0.1 rlang_0.2.0 bindr_0.1(这些是来自"session info"截图的其他信息)
在使用randomForest之前,我想使用train包进行交叉验证并找到模型参数的最佳值 .
# set tunning parameters
control <- trainControl(method = "cv", number = 5)
# random forest model
rf.model <- train(Sales ~ ., data = my.data, method = "parRF", trControl = control, prox = TRUE, allowParallel = TRUE)
会话花了很长时间才运行,即使我使用 method = "parRF"
,随机林的并行实现,它仍然无法正常工作 .
当我切换到使用randomForest时,它有同样的问题,会话永远,并且永远不会完成 .
# random forest model
forest.model <- randomForest(Sales ~ ., data = my.data, mtry = 15, ntree = 1000)
你能看到我为 train()
和 randomForest()
做错了吗?