数据集可以从http://archive.ics.uci.edu/ml/machine-learning-databases/wine-quality/下载
出现以下错误:
formula(formula, data = data) :
invalid model formula in ExtractVars
使用以下代码:
install.packages("rpart")
library("rpart")
# you'll need to change the following from windows to work on a linux box:
mydata <- read.csv(file="c:/Users/md7968/downloads/winequality-red.csv")
# grow tree
fit <- rpart(YouSweetBoy ~ "residual sugar" + "citric acid", method = "class", data = mydata
请注意,我已将CSV文件中的分隔符更改为逗号 .
也许它没有正确读取数据 . 原谅我,我是R的新手,而不是一个非常优秀的程序员 .
2 回答
看看
names(mydata)
. 创建data.frame时,read.table()
会将"bad"列名称转换为好名称 . 您可以__36276_ t)在列名中有空格,因此R将空格更改为句点 . 另外,你不应该在公式中引用字符串 . 尝试(我不知道“YouSweetBoy”应该是什么,因为那不是在数据集中所以我把它改为“质量”) .
删除独立变量名称中的空格并取消引号使其起作用 .
而不是“残糖”,使用residual_sugar