我有兴趣应用折刀分析来量化通过逻辑回归估计的系数的不确定性 . 我使用glm(family ='binomial')因为我的自变量是0-1格式 .
我的数据集有76000个obs,我使用7个独立变量加上一个偏移量 . 这个想法涉及将数据分成5个随机子集,然后通过从数据集中一次删除一个子集来获得7个估计参数 . 然后我可以估计参数的不确定性 .
我理解程序,但我无法在R中完成
这是我适合的模型:
glm(f_ocur ~ altitud + UTM_X + UTM_Y + j_sin + j_cos + temp_res + pp +
offset(log(1/off)), data = mydata, family = 'binomial')
有谁知道如何才能实现这一目标?
1 回答
Jackknifing逻辑回归模型是非常低效的 . 但是,一个简单的时间密集型方法将是这样的:
这是留一系数系数估算的矩阵 . 该矩阵的协方差矩阵估计参数估计的协方差矩阵 .
使用
glm
的主力函数glm.fit
可以显着改善时间 . 您可以通过线性化模型来进一步推进(使用一步估计,将牛顿Raphson算法中的niter
限制为仅一次迭代,使用Jackknife SE,一步估算器仍然稳健,无偏,整个位......)