首页 文章

分析R中的相关数据:线性,岭回归,PCR

提问于
浏览
2

我有5个变量 y, x_1, x_2, x_3, x_4 的时间序列观察,任务是找出哪些 x es负责 y 中的变化 . 现在问题是所有这些都是强相互关联的并且表现出共线性 . x_1, x_2, x_3, x_4 没有成对或以任何其他方式共同存在的隐藏组件 - 它们只是自然相关 .

可以预见的是,线性回归给出了不合理的结果,其中系数在去除其中一个变量后变化很大,这是高共线数据的正常图像 .

正如wiki所述,多重共线性的一些补救措施是使用岭回归和主成分回归 . 但是,当我使用 lm.ridge 方法时,它给出了与 lm 完全相同的系数 .

在这种情况下PCR可以帮助吗?如果是这样,在R中检索系数和p值的简单方法是什么?像 lm 函数的汇总表 .

1 回答

  • 6

    看一下

    Dormann等人 . (2012年) . 共线性:审查处理它的方法和评估其性能的模拟研究 . 付费墙,替代链接

    审查可用的方法 .

    R代码和数据可用here :)

相关问题