我正在分析UCI数据库中的葡萄酒质量数据集 . 它是来自excel文件的数据 . 我正在尝试做一个简单的箱线图,显示葡萄酒质量最重要的预测因子(响应变量) . 一切都是定量的,质量是二项式的 . 我尝试使用二项式,然后将数据拆分为二项式响应 . 我只得到非常奇怪的箱形图,并不知道如何修改它们 . 有什么建议?
这是我正在做的简单代码:
boxplot(wine$alcohol~wine$sulphates, data=wine)
例:
如果我使用质量,它仍然很糟糕:
boxplot(wine$quality~wine$alcohol, data=wine)
1 回答
也许您想要将预测变量分类为这样?