首页 文章

LRM与GLM输出的不同系数

提问于
浏览
0

首先请注意,我无法在数据集之外的任何内容上重现此错误 . 但是,这是一般的想法 . 我有一个数据框,我正在尝试构建一个简单的逻辑回归来理解Amount对IsWon的边际效应 . 两个模型都表现不佳,毕竟它是一个预测器,但它们产生两个不同的系数

首先是glm输出:

> summary(mod4)

Call:
glm(formula = as.factor(IsWon) ~ Amount, family = "binomial", 
    data = final_data_obj_samp)

Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-1.2578  -1.2361   1.0993   1.1066   3.7307  

Coefficients:
                  Estimate     Std. Error z value              Pr(>|z|)    
(Intercept)  0.18708622416  0.03142171761  5.9540        0.000000002616 ***
Amount      -0.00000315465  0.00000035466 -8.8947 < 0.00000000000000022 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 6928.69  on 4999  degrees of freedom
Residual deviance: 6790.87  on 4998  degrees of freedom
AIC: 6794.87

Number of Fisher Scoring iterations: 6

请注意金额的负系数 .

现在来自rms的lrm功能

Logistic Regression Model

lrm(formula = as.factor(IsWon) ~ Amount, data = final_data_obj_samp, 
    x = TRUE, y = TRUE)
                       Model Likelihood     Discrimination    Rank Discrim.    
                          Ratio Test            Indexes          Indexes       
Obs           5000    LR chi2     137.82    R2       0.036    C       0.633    
 0            2441    d.f.             1    g        0.300    Dxy     0.266    
 1            2559    Pr(> chi2) <0.0001    gr       1.350    gamma   0.288    
max |deriv| 0.0007                          gp       0.054    tau-a   0.133    
                                            Brier    0.242                     

          Coef   S.E.   Wald Z Pr(>|Z|)
Intercept 0.1871 0.0314  5.95  <0.0001 
Amount    0.0000 0.0000 -8.89  <0.0001

两个模型都做得不好,但是一个估计正系数而另一个估计负系数 . 当然, Value 观可以忽略不计,但有人可以帮我理解这一点 .

对于它的 Value ,这里是lrm对象的情节 .

> plot(Predict(mod2, fun=plogis))

enter image description here

该图显示预测的获胜概率与金额有非常负的关系 .

2 回答

  • 0

    您不应该依赖 summary 的打印结果来检查系数 . 摘要表由 print 控制,因此总是会出现舍入问题 . 你试过 mod4$coef (得到 glm model mod4 的系数)和 mod2$coef (得到 lrm model mod2 的系数)?最好阅读 ?glm?lrm 的"values"部分 .

  • 1

    似乎 lrm 正在将系数估计为最接近的±0.0000值 . 由于系数值远低于该系数值,因此简单地将其舍入为0.0000 . 因此它似乎是积极的,但实际上可能不是 .

相关问题