在查看R中的cor.test函数时,用于计算(以及其他)Pearson相关性,我看到后来用于计算p值的t统计量是
STATISTIC <- c(t = sqrt(df) * r/sqrt(1 - r^2))
其中r是相关度量,df是自由度数 .
但是皮尔逊相关性的t检验似乎是:(参见http://en.wikipedia.org/wiki/Pearson_product-moment_correlation_coefficient#Testing_using_Student.27s_t-distribution)
sqrt( ( n - 2 ) / ( 1 - r^2 ) )
一如既往,鉴于cor.test被广泛使用,我怀疑我的第一个误解 . 有谁知道cor.test中使用的定义是否正确?
谢谢
1 回答
如果再看一下代码,你会发现它们实际上是等价的 .
首先,你忘记了维基百科的等式中的
r
. 你的等式应该是:现在,让我们做一些简化
STATISTIC <- c(t = sqrt(df) * r/sqrt(1 - r^2))
df
实际上是n-2
改写
简
你有同等的 .