也许这是一个多余的问题,但在看了下面的问题之后我有点好奇:Error selecting a column after grouping the dataframe using group_by from dplyr 0.3.02 .

这在dplyr的更高版本中似乎不是问题 . 重新运行示例(dplyr 0.4.3)时,我没有得到“Index out of bounds”消息,我可以选择列(虽然输出的显示略有不同) .

但是,它让我想知道分组data.frame是否会导致使用dplyr动词之外的意外结果(这有望导致预期的结果)?

例如,这似乎产生完全相同的结果:

library(dplyr)
data(mtcars)
group_cyl<-group_by(mtcars, cyl)
summary(lm(mpg~hp, mtcars))
summary(lm(mpg~hp, group_cyl))

虽然这显然不是:

summarise(mtcars, mean(hp))
summarise(group_cyl, mean(hp))