首页 文章

Jackknife在逻辑回归中

提问于
浏览
0

我有兴趣应用折刀分析来量化通过逻辑回归估计的系数的不确定性 . 我使用glm(family ='binomial')因为我的自变量是0-1格式 .

我的数据集有76000个obs,我使用7个独立变量加上一个偏移量 . 这个想法涉及将数据分成5个随机子集,然后通过从数据集中一次删除一个子集来获得7个估计参数 . 然后我可以估计参数的不确定性 .

我理解程序,但我无法在R中完成

这是我适合的模型:

glm(f_ocur ~ altitud + UTM_X + UTM_Y + j_sin + j_cos + temp_res + pp +
             offset(log(1/off)), data = mydata, family = 'binomial')

有谁知道如何才能实现这一目标?

1 回答

  • 1

    Jackknifing逻辑回归模型是非常低效的 . 但是,一个简单的时间密集型方法将是这样的:

    Formula <- f_ocur~altitud+UTM_X+UTM_Y+j_sin+j_cos+temp_res+pp+offset(log(1/off))
    coefs <- sapply(1:nrow(mydata), function(i)
      coef(glm(Formula, data=mydata[-i, ], family='binomial'))
    )
    

    这是留一系数系数估算的矩阵 . 该矩阵的协方差矩阵估计参数估计的协方差矩阵 .

    使用 glm 的主力函数 glm.fit 可以显着改善时间 . 您可以通过线性化模型来进一步推进(使用一步估计,将牛顿Raphson算法中的 niter 限制为仅一次迭代,使用Jackknife SE,一步估算器仍然稳健,无偏,整个位......)

相关问题