首页 文章

R中的多元回归:协变对因子的影响还是相反?

提问于
浏览
1

我知道对于具有统计背景的人来说,这可能是一个非常简单的问题 . 然而,我找不到适合我(不是那样)特殊情况的明确答案:(

我有一个回归模型,有两个分类预测因子(A,有两个级别A1和A2和B,有两个级别B1和B2),还有一个数字预测器Z.

我对Z和B之间的相互作用感兴趣,但特别是在A的一个级别(A1,我的参考级别) .

因此,我安装了以下型号:

lm(Y ~ A/B*Z, data=df)

这让我想到以下内容:

Fixed effects:
              Estimate Std. Error         df t value Pr(>|t|)    
(Intercept)   -0.80420    0.02185 3160.00000 -36.811  < 2e-16 ***
A2             1.55943    0.02968 3160.00000  52.541  < 2e-16 ***
Z              0.07688    0.02561 3160.00000   3.002 0.002706 ** 
A1:B2          0.12481    0.03413 3160.00000   3.657 0.000259 ***
A2:B2         -0.09231    0.03500 3160.00000  -2.637 0.008397 ** 
A2:Z           0.05906    0.03072 3160.00000   1.923 0.054590 .  
A1:B2:Z       -0.06872    0.03959 3160.00000  -1.736 0.042668 *  
A2:B2:Z        0.01222    0.03385 3160.00000   0.361 0.718208

我相信对我来说特别感兴趣的3行是:

Z              0.07688    0.02561 3160.00000   3.002 0.002706 ** 
A1:B2          0.12481    0.03413 3160.00000   3.657 0.000259 ***
A1:B2:Z       -0.06872    0.03959 3160.00000  -1.736 0.042668 *

据我所知,第一行代表我的结果Y和线性预测器Z之间的线性关系,在我的参考水平A1B1中(并且这不是"main effect") . 因此,我们可以说这两者之间存在正线性关系 .

此外,从A1B1到A1B2(第二行)导致Y的显着增加 .

第三行是我的问题 . 它是这样说的:

  • 对于Z的每次增加,"B2"(第二行)的效果会减小(约为 0.12-0.06=0.6 )?

  • 或者在B2中,Z(第一行)的效果明显更小(约为 0.07-0.06=0.1 )?

对我来说更令人困惑的是,如果我在公式中交换这些变量,结果是相同的:

lm(Y ~ A/Z*B, data=df)

Fixed effects:
              Estimate Std. Error         df t value Pr(>|t|)    
...
B2             0.12481    0.03413 3160.00000   3.657 0.000259 ***
A1:Z           0.07688    0.02561 3160.00000   3.002 0.002706 ** 
...
A1:Z:B2       -0.06872    0.03959 3160.00000  -1.736 0.082668 .  
...

1 回答

  • 1

    实际上,如果我理解你的问题,你应该将你的结果的A1:B2:Z行解释为:当 A==A1B==B1 时,增加 Z 为1使得Y减少0.06872 .

    重要的是要理解这种减少是单独增加 Z 的效果(0.07688) . 在这种情况下,交互 A2:Z (-0.09231)并不重要 A!=A1 . 由于相互作用, Z 的效果会根据我的变量 AB 的值而变化 .

    你在这里有一个像这样的线性模型:

    Y = int + A2 + Z + A1:B2 + A2:B2 + A2:Z + A1:B2:Z + A2:B2:Z
    
    
    Y = -0.80420 + 1.55943*A2 + 1.55943*Z + 0.12481*A1:B2 - 0.09231*A2:B2 + 0.05906*A2:Z - 0.06872*A1:B2:Z + 0.01222*A2:B2:Z
    

    其中 A1A2B1B2 是取0或1的变量或特定观察值 . 将所有这些变量替换为您正在寻找的正确值并解决方程式 . 对于B的影响:

    Y = -0.80420 + 1.55943*0 + 1.55943*Z + 0.12481*1*B2 - 0.09231*0*B2 + 0.05906*0*:Z - 0.06872*1*B2:Z + 0.01222*0*B2:Z 
    Y = -0.80420 + 1.55943*Z + 0.12481*B2 + 0.06872*B2:Z
    

    所以如果 B==B1 ,那么 B2==0

    Y = -0.80420 + 1.55943*Z + 0.12481*0 + 0.06872*0:Z
    Y = -0.80420 + 1.55943*Z
    

    所以增加了1.55943的Y,增加了一个Z.

    如果是 B==B2 ,那么 B2==1

    Y = -0.80420 + 1.55943*Z + 0.12481*1 + 0.06872*1:Z
    Y = 0.92901 + 1.62815*Z
    

    因此增加了1.62815 Y,增加了一个Z.

    它被解释为:当 B==B2 时,Z的影响更为重要 .

    注意:更改模型的顺序不应该有任何效果 .

相关问题