我想在两个不同的组(由group_by定义)中的两个向量之间 Build 关联 . 解决方案需要基于dplyr .

我的数据采用所谓的CDISC格式 . 为简单起见:这里有一些虚拟数据 . (注意一列(“值”)包含所有数据)

n=5
bmi<-rnorm(n=n,mean=25)
glucose<-rnorm(n=n,mean=5)
insulin<-rnorm(n=n,mean=10)
id<-rep(paste0("id",1:n),3)
myData<-data.frame(id=id,measurement=c(rep("BMI",n),rep("glucose",n),rep("insulin",n)),values=c(bmi,glucose,insulin))

请记住,使用这种数据的所有函数都是使用dplyr包,例如:

myData %>% group_by(measurement) %>% summarise(mean(values), n())

我的问题是,如何获得葡萄糖和胰岛素(cor(葡萄糖,胰岛素))之间的相关性?或者以更一般的方式:我如何获得两组之间的相关性 .

以下解决方案显然是非常错误的(但可能有助于理解我的问题):

myData %>% group_by(measurement) %>% summarise(cor(glucose,insulin))

我希望你能帮助我,我可能会忽略一些基本的dplyr .

非常感谢先进

托马斯