首页 文章

为什么我的boxplot代码没有给我一个正常的boxplot? [等候接听]

提问于
浏览
0

我正在分析UCI数据库中的葡萄酒质量数据集 . 它是来自excel文件的数据 . 我正在尝试做一个简单的箱线图,显示葡萄酒质量最重要的预测因子(响应变量) . 一切都是定量的,质量是二项式的 . 我尝试使用二项式,然后将数据拆分为二项式响应 . 我只得到非常奇怪的箱形图,并不知道如何修改它们 . 有什么建议?

这是我正在做的简单代码:

boxplot(wine$alcohol~wine$sulphates, data=wine)

例:

如果我使用质量,它仍然很糟糕:

boxplot(wine$quality~wine$alcohol, data=wine)

1 回答

  • 0

    也许您想要将预测变量分类为这样?

    white.url <- "https://archive.ics.uci.edu/ml/machine-learning-databases/wine-quality/winequality-white.csv"
    white.raw <- read.csv(white.url, header = TRUE, sep = ";")
    wine <- white.raw
    
    .variable <- "alcohol"
    break_cuts <- quantile(wine[,.variable], seq(0.1, 1, by = 0.3))
    wine$cat <- cut(wine[,.variable], breaks = break_cuts)
    
    boxplot(quality~cat, data=wine, 
            xlab = .variable, ylab = "quality", outline = FALSE)
    

相关问题