我在pandas数据框中有一个数据,如:
df =
X1 X2 X3 Y
0 1 2 10 5.077
1 2 2 9 32.330
2 3 3 5 65.140
3 4 4 4 47.270
4 5 2 9 80.570
我想做多元回归分析 . 这里Y是因变量,x1,x2和x3是独立变量 . 每个自变量与因变量之间的相关性是:
df.corr():
X1 X2 X3 Y
X1 1.000000 0.353553 -0.409644 0.896626
X2 0.353553 1.000000 -0.951747 0.204882
X3 -0.409644 -0.951747 1.000000 -0.389641
Y 0.896626 0.204882 -0.389641 1.000000
正如我们在这里看到的,y与x1的相关性最高,所以我选择了x1作为第一个自变量 . 在这个过程之后,我试图选择与y具有最高偏相关的第二个自变量 . 所以我的问题是如何在这种情况下找到偏相关?
我们将非常感谢您的帮助 .
1 回答
Pairwise ranks between Y (last col) and others
如果你只是想找到
Y
和其他人之间的相关等级,那就干了 -样品运行 -
Pairwise ranks between all columns
如果你试图找到彼此之间所有列之间的等级,我们会有这样的方法 -
样品运行 -