我有一个很大的数据帧(形状100 000 * 192) . 我已经计算了每个属性的皮尔森系数 . 现在我正在寻找一种计算每组pearson相关性的方法 . 我的意思是,现在我有

if A then B

我想计算

if (A AND B) then C 
if (A AND B AND C) then (D AND E)

例如

DataFrame 1 
   A  B  C
 0|0  0  1 
 1|1  0  0 
 2|0  1  0 
 3|1  1  1

这里A列和C列似乎没有很强的相关性,A和B或B和C都没有,但是当你拿A和B然后你与C有关(如果A = B则C = 1,否则C = 0) . 我希望它有助于理解 .

有没有任何函数或库已经这样做了,或者我将不得不在我的数据帧上使用 df.corr()df.corr() 函数编写大量的迭代代码?