我有一个大型数据集,我正在尝试对数据进行分组 . 我正在尝试使用dplyr和mutate创建一个新列,这是每个组的平均值 . 然后我想看看这些方法与仅一个类别的平均值之间的区别 .
此问题可能与mtcars数据集有关 . 如何通过“cyl”和“gear”对mtcars数据进行分组,然后为每个组取“mpg”的平均值 . 然后我想看看每组的“mpg”的平均值与特别是所有“齿轮”= = 5的车的差异,但是有变量“cyl” .
如果我像其他人一样问同样的问题,我很抱歉,但我一直无法找到这个具体的问题 .
df <- mtcars
df2 <- df %>% group_by(cyl, gear) %>% mutate(mean_mpg = mean(mpg))
3 回答
结果
这是相当蛮力但它应该给你你想要的 . 我得到
cyl
和gear
的平均mpg
然后只是cyl
忽略齿轮然后mpg
忽略cyl
.根据你的评论,我认为这就是你所追求的: