R中的多元回归：协变对因子的影响还是相反？-Java 学习之路

我知道对于具有统计背景的人来说，这可能是一个非常简单的问题 . 然而，我找不到适合我（不是那样）特殊情况的明确答案:(

我有一个回归模型，有两个分类预测因子（A，有两个级别A1和A2和B，有两个级别B1和B2），还有一个数字预测器Z.

我对Z和B之间的相互作用感兴趣，但特别是在A的一个级别（A1，我的参考级别） .

因此，我安装了以下型号：

lm(Y ~ A/B*Z, data=df)

这让我想到以下内容：

Fixed effects:
              Estimate Std. Error         df t value Pr(>|t|)    
(Intercept)   -0.80420    0.02185 3160.00000 -36.811  < 2e-16 ***
A2             1.55943    0.02968 3160.00000  52.541  < 2e-16 ***
Z              0.07688    0.02561 3160.00000   3.002 0.002706 ** 
A1:B2          0.12481    0.03413 3160.00000   3.657 0.000259 ***
A2:B2         -0.09231    0.03500 3160.00000  -2.637 0.008397 ** 
A2:Z           0.05906    0.03072 3160.00000   1.923 0.054590 .  
A1:B2:Z       -0.06872    0.03959 3160.00000  -1.736 0.042668 *  
A2:B2:Z        0.01222    0.03385 3160.00000   0.361 0.718208

我相信对我来说特别感兴趣的3行是：

Z              0.07688    0.02561 3160.00000   3.002 0.002706 ** 
A1:B2          0.12481    0.03413 3160.00000   3.657 0.000259 ***
A1:B2:Z       -0.06872    0.03959 3160.00000  -1.736 0.042668 *

据我所知，第一行代表我的结果Y和线性预测器Z之间的线性关系，在我的参考水平A1B1中（并且这不是"main effect"） . 因此，我们可以说这两者之间存在正线性关系 .

此外，从A1B1到A1B2（第二行）导致Y的显着增加 .

第三行是我的问题 . 它是这样说的：

对于Z的每次增加，"B2"（第二行）的效果会减小（约为 0.12-0.06=0.6 ）？
或者在B2中，Z（第一行）的效果明显更小（约为 0.07-0.06=0.1 ）？

对我来说更令人困惑的是，如果我在公式中交换这些变量，结果是相同的：

lm(Y ~ A/Z*B, data=df)

Fixed effects:
              Estimate Std. Error         df t value Pr(>|t|)    
...
B2             0.12481    0.03413 3160.00000   3.657 0.000259 ***
A1:Z           0.07688    0.02561 3160.00000   3.002 0.002706 ** 
...
A1:Z:B2       -0.06872    0.03959 3160.00000  -1.736 0.082668 .  
...

1 回答

1
实际上，如果我理解你的问题，你应该将你的结果的A1：B2：Z行解释为：当 A==A1 和 B==B1 时，增加 Z 为1使得Y减少0.06872 .

重要的是要理解这种减少是单独增加 Z 的效果（0.07688） . 在这种情况下，交互 A2:Z （-0.09231）并不重要 A!=A1 . 由于相互作用， Z 的效果会根据我的变量 A 和 B 的值而变化 .

你在这里有一个像这样的线性模型：
```
Y = int + A2 + Z + A1:B2 + A2:B2 + A2:Z + A1:B2:Z + A2:B2:Z


Y = -0.80420 + 1.55943*A2 + 1.55943*Z + 0.12481*A1:B2 - 0.09231*A2:B2 + 0.05906*A2:Z - 0.06872*A1:B2:Z + 0.01222*A2:B2:Z
```
其中 A1 ， A2 ， B1 和 B2 是取0或1的变量或特定观察值 . 将所有这些变量替换为您正在寻找的正确值并解决方程式 . 对于B的影响：
```
Y = -0.80420 + 1.55943*0 + 1.55943*Z + 0.12481*1*B2 - 0.09231*0*B2 + 0.05906*0*:Z - 0.06872*1*B2:Z + 0.01222*0*B2:Z 
Y = -0.80420 + 1.55943*Z + 0.12481*B2 + 0.06872*B2:Z
```
所以如果 B==B1 ，那么 B2==0
```
Y = -0.80420 + 1.55943*Z + 0.12481*0 + 0.06872*0:Z
Y = -0.80420 + 1.55943*Z
```
所以增加了1.55943的Y，增加了一个Z.

如果是 B==B2 ，那么 B2==1
```
Y = -0.80420 + 1.55943*Z + 0.12481*1 + 0.06872*1:Z
Y = 0.92901 + 1.62815*Z
```
因此增加了1.62815 Y，增加了一个Z.

它被解释为：当 B==B2 时，Z的影响更为重要 .

注意：更改模型的顺序不应该有任何效果 .
回复于 2024-04-30T09:16:12+08:00

R中的多元回归：协变对因子的影响还是相反？

1 回答

相关问题