Home Articles

循环训练数据r的循环列值

Asked
Viewed 980 times
0

我正在尝试从数据框架构建培训和测试模型 . 我正在使用随机森林方法并构建模型 .
我的数据框有6列,第一列是结果(是/否),其余5列是独立变量 . 我使用所有自变量构建模型(结果〜 . ,data = training,method = "rf") . 我想要做的是尝试所有可能的自变量组合并生成一个模型(如col1,col1 col2,col1 col2 col3等等) . 我的数据框可能有120种组合 .
我需要帮助在循环中自动执行此操作,但我无法弄清楚如何将循环放在一起 . 提前致谢 .

data <- read.csv("temp.csv", header = TRUE)
splitdata <- createDataPartition(y=data$var1, p=0.75)
training <- df[splitdata,]
testing  <- df[-splitdata,]
no_of_cols <- 2:ncol(training)
for (i in no_col)
{
   permn (no_of_col)
   #model <- train(var1 ~ ., data=training,  method="rf")
    model[i] <- train(var1 ~ training[,i], data=training,  method="rf")        
    predictions[i] <- predict(model[i],newdata=testing)
}

1 Answer

  • 0

    我相信你需要的只是快速修复你的for循环:

    for (i in 1:no_col)
    {
      code
    }
    

Related