我正在尝试进行多项logit,我的自变量是绝对的 . 我有两个分类变量 - 高中学历的 edu1 和大学学历的 edu2 . 变量是虚拟变量( edu1=1 表示那些具有高中学历的人, edu1=0 没有)我想要结果,以便我可以将结果与拥有大学学位的人进行比较 . 但是,当我执行 mlogit edu* 时,模型会自动在模型中包含 edu1 而不是 edu2 . 有没有办法扭转这种情况并包括 edu2 而不包括 edu 1?
edu1
edu2
edu1=1
edu1=0
mlogit edu*
edu
除非丢弃常量,否则不能在模型中同时使用两者 . 谷歌“虚拟变量陷阱”,看看为什么 . 这是一个例子:
. webuse sysdsn1, clear (Health insurance data) . recode male (0=1) (1=0), gen(female) (644 differences between male and female) . mlogit insure male female, nocons nolog Multinomial logistic regression Number of obs = 616 Wald chi2(4) = 149.44 Log likelihood = -553.40712 Prob > chi2 = 0.0000 ------------------------------------------------------------------------------ insure | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------- Indemnity | (base outcome) -------------+---------------------------------------------------------------- Prepaid | male | .3001046 .1703301 1.76 0.078 -.0337363 .6339455 female | -.1772065 .0968274 -1.83 0.067 -.3669847 .0125718 -------------+---------------------------------------------------------------- Uninsure | male | -1.529395 .3059244 -5.00 0.000 -2.128996 -.9297944 female | -1.989585 .1884768 -10.56 0.000 -2.358993 -1.620177 ------------------------------------------------------------------------------ . mlogit insure male, nolog Multinomial logistic regression Number of obs = 616 LR chi2(2) = 6.38 Prob > chi2 = 0.0413 Log likelihood = -553.40712 Pseudo R2 = 0.0057 ------------------------------------------------------------------------------ insure | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------- Indemnity | (base outcome) -------------+---------------------------------------------------------------- Prepaid | male | .477311 .1959283 2.44 0.015 .0932987 .8613234 _cons | -.1772065 .0968274 -1.83 0.067 -.3669847 .0125718 -------------+---------------------------------------------------------------- Uninsure | male | .46019 .3593233 1.28 0.200 -.2440708 1.164451 _cons | -1.989585 .1884768 -10.56 0.000 -2.358993 -1.620177 ------------------------------------------------------------------------------
请注意,在第二个规范中,常数是女性效应,男性变得恒定加上男性系数 . 这与上面没有的常量规范相匹配 .
如果模型中有其他假人,事情会变得复杂一些 . 常量将对应于每组虚拟变量中的所有省略的类别 .
1 回答
除非丢弃常量,否则不能在模型中同时使用两者 . 谷歌“虚拟变量陷阱”,看看为什么 . 这是一个例子:
请注意,在第二个规范中,常数是女性效应,男性变得恒定加上男性系数 . 这与上面没有的常量规范相匹配 .
如果模型中有其他假人,事情会变得复杂一些 . 常量将对应于每组虚拟变量中的所有省略的类别 .