我在区间[0,1]中有2个系列的45个值 . 第一个系列是人类生成的标准,第二个系列是计算机生成的(全系列在这里http://www.copypastecode.com/74844/) . 第一个系列逐渐排序 .
0.909090909 0.216196598
0.909090909 0.111282099
0.9 0.021432587
0.9 0.033901106
...
0.1 0.003099256
0 0.001084533
0 0.008882249
0 0.006501463
现在我要评估的是第二个系列中订单保留的程度,因为第一个系列是单调的 . Pearson correlation 是0.454763067,但我认为这种关系不是线性的,所以这个值很难解释 .
一种自然的方法是使用 Spearman rank correlation ,在这种情况下是0.670556181 . 我注意到随机值,当Pearson非常接近0时,Spearman等级相关性上升到0.5,所以0.67的值似乎非常低 .
您将使用什么来评估这两个系列之间的顺序相似性?
1 回答
由于它是您关注的顺序(等级),因此Spearman等级相关是更有意义的度量 .
你如何生成这些随机值?我刚刚用一个使用numpy生成的随机数进行了一个简单的实验,我没有看到:
第一个数字(-0.01)是秩相关系数;第二个数字(0.66)是the associated p-value .