我试图用二元自变量运行线性回归 - 我期望得到1个估计值,将值为1的值与值为0的值进行比较,但是,当我运行模型时,我得到2个估计值 - 1表示二进制变量的每个值?关于我可能做错什么的任何想法? (我已经检查过,我的变量肯定是二进制编码为0和1)
当我在mtcars dtaset上尝试它时,这工作正常
Call:
lm(formula = mpg ~ factor(vs), data = mtcars)
Coefficients:
(Intercept) factor(vs)1
16.62 7.94
...但不在我的数据集中
Call:
lm(formula = bmi_18 ~ factor(art_sc), data = ds)
Coefficients:
(Intercept) factor(art_sc)0 factor(art_sc)Yes
23.5550 -1.1835 -0.7439
1 回答
感谢您的帮助,看起来我的变量确实有3个级别,这就是为什么我得到奇怪的结果 . 它在STATA中作为二进制文件出现,这就是为什么我确信它在R中是二进制的 .