首页 文章

在R中使用rpart函数时,在ExtractVars中获取无效的模型公式

提问于
浏览
1

数据集可以从http://archive.ics.uci.edu/ml/machine-learning-databases/wine-quality/下载

出现以下错误:

formula(formula, data = data) : 
  invalid model formula in ExtractVars

使用以下代码:

install.packages("rpart")
library("rpart")

# you'll need to change the following from windows to work on a linux box:
mydata <- read.csv(file="c:/Users/md7968/downloads/winequality-red.csv")

# grow tree 
fit <- rpart(YouSweetBoy ~ "residual sugar" + "citric acid", method = "class", data = mydata

请注意,我已将CSV文件中的分隔符更改为逗号 .

也许它没有正确读取数据 . 原谅我,我是R的新手,而不是一个非常优秀的程序员 .

2 回答

  • 0

    看看 names(mydata) . 创建data.frame时, read.table() 会将"bad"列名称转换为好名称 . 您可以__36276_ t)在列名中有空格,因此R将空格更改为句点 . 另外,你不应该在公式中引用字符串 . 尝试

    fit <- rpart(quality ~ residual.sugar + citric.acid, method = "class", data = mydata)
    

    (我不知道“YouSweetBoy”应该是什么,因为那不是在数据集中所以我把它改为“质量”) .

  • 4

    删除独立变量名称中的空格并取消引号使其起作用 .

    而不是“残糖”,使用residual_sugar

相关问题