我有一个很大的数据帧(形状100 000 * 192) . 我已经计算了每个属性的皮尔森系数 . 现在我正在寻找一种计算每组pearson相关性的方法 . 我的意思是,现在我有
if A then B
我想计算
if (A AND B) then C
if (A AND B AND C) then (D AND E)
例如
DataFrame 1
A B C
0|0 0 1
1|1 0 0
2|0 1 0
3|1 1 1
这里A列和C列似乎没有很强的相关性,A和B或B和C都没有,但是当你拿A和B然后你与C有关(如果A = B则C = 1,否则C = 0) . 我希望它有助于理解 .
有没有任何函数或库已经这样做了,或者我将不得不在我的数据帧上使用 df.corr()
的 df.corr()
函数编写大量的迭代代码?