我有5个变量 y, x_1, x_2, x_3, x_4
的时间序列观察,任务是找出哪些 x
es负责 y
中的变化 . 现在问题是所有这些都是强相互关联的并且表现出共线性 . x_1, x_2, x_3, x_4
没有成对或以任何其他方式共同存在的隐藏组件 - 它们只是自然相关 .
可以预见的是,线性回归给出了不合理的结果,其中系数在去除其中一个变量后变化很大,这是高共线数据的正常图像 .
正如wiki所述,多重共线性的一些补救措施是使用岭回归和主成分回归 . 但是,当我使用 lm.ridge
方法时,它给出了与 lm
完全相同的系数 .
在这种情况下PCR可以帮助吗?如果是这样,在R中检索系数和p值的简单方法是什么?像 lm
函数的汇总表 .
1 回答
看一下
审查可用的方法 .
R代码和数据可用here :)