我知道对于具有统计背景的人来说,这可能是一个非常简单的问题 . 然而,我找不到适合我(不是那样)特殊情况的明确答案:(
我有一个回归模型,有两个分类预测因子(A,有两个级别A1和A2和B,有两个级别B1和B2),还有一个数字预测器Z.
我对Z和B之间的相互作用感兴趣,但特别是在A的一个级别(A1,我的参考级别) .
因此,我安装了以下型号:
lm(Y ~ A/B*Z, data=df)
这让我想到以下内容:
Fixed effects:
Estimate Std. Error df t value Pr(>|t|)
(Intercept) -0.80420 0.02185 3160.00000 -36.811 < 2e-16 ***
A2 1.55943 0.02968 3160.00000 52.541 < 2e-16 ***
Z 0.07688 0.02561 3160.00000 3.002 0.002706 **
A1:B2 0.12481 0.03413 3160.00000 3.657 0.000259 ***
A2:B2 -0.09231 0.03500 3160.00000 -2.637 0.008397 **
A2:Z 0.05906 0.03072 3160.00000 1.923 0.054590 .
A1:B2:Z -0.06872 0.03959 3160.00000 -1.736 0.042668 *
A2:B2:Z 0.01222 0.03385 3160.00000 0.361 0.718208
我相信对我来说特别感兴趣的3行是:
Z 0.07688 0.02561 3160.00000 3.002 0.002706 **
A1:B2 0.12481 0.03413 3160.00000 3.657 0.000259 ***
A1:B2:Z -0.06872 0.03959 3160.00000 -1.736 0.042668 *
据我所知,第一行代表我的结果Y和线性预测器Z之间的线性关系,在我的参考水平A1B1中(并且这不是"main effect") . 因此,我们可以说这两者之间存在正线性关系 .
此外,从A1B1到A1B2(第二行)导致Y的显着增加 .
第三行是我的问题 . 它是这样说的:
-
对于Z的每次增加,"B2"(第二行)的效果会减小(约为
0.12-0.06=0.6
)? -
或者在B2中,Z(第一行)的效果明显更小(约为
0.07-0.06=0.1
)?
对我来说更令人困惑的是,如果我在公式中交换这些变量,结果是相同的:
lm(Y ~ A/Z*B, data=df)
Fixed effects:
Estimate Std. Error df t value Pr(>|t|)
...
B2 0.12481 0.03413 3160.00000 3.657 0.000259 ***
A1:Z 0.07688 0.02561 3160.00000 3.002 0.002706 **
...
A1:Z:B2 -0.06872 0.03959 3160.00000 -1.736 0.082668 .
...
1 回答
实际上,如果我理解你的问题,你应该将你的结果的A1:B2:Z行解释为:当
A==A1
和B==B1
时,增加Z
为1使得Y减少0.06872 .重要的是要理解这种减少是单独增加
Z
的效果(0.07688) . 在这种情况下,交互A2:Z
(-0.09231)并不重要A!=A1
. 由于相互作用,Z
的效果会根据我的变量A
和B
的值而变化 .你在这里有一个像这样的线性模型:
其中
A1
,A2
,B1
和B2
是取0或1的变量或特定观察值 . 将所有这些变量替换为您正在寻找的正确值并解决方程式 . 对于B的影响:所以如果
B==B1
,那么B2==0
所以增加了1.55943的Y,增加了一个Z.
如果是
B==B2
,那么B2==1
因此增加了1.62815 Y,增加了一个Z.
它被解释为:当
B==B2
时,Z的影响更为重要 .注意:更改模型的顺序不应该有任何效果 .