我有一个带有50个数字列的分组数据框(使用 dplyr
),使用其中一列将其拆分成组 . 我想计算所有非分组列和一个特定列之间的相关矩阵 .
mtcars
数据集的示例:
data(mtcars)
cor(mtcars[,2:11], mtcars[,2])
返回每个帆船的里程数与其他变量之间的相关性列表 .
但是,我想说,我希望计算每组气缸的相同相关性,例如:
library(dplyr)
mtcars <-
mtcars %>%
group_by(cyl)
我该怎么办?我在想类似的东西
mtcars %>%
group_by(cyl) %>%
summarise_each(funs(cor(...))
但是我不知道在 ...
中放什么,因为我不知道如何在 dplyr
链中指定一个列 .
Related :Linear model and dplyr - a better solution?的答案与@ akrun的答案非常相似 . 此外,在交叉验证时:https://stats.stackexchange.com/questions/4040/r-compute-correlation-by-group还有其他解决方案使用的包不是 dplyr
.
1 回答
我们可以使用
do
.NOTE:
t
部分由@Alex提供要么