我想计算预测值和标准误差,但我不能简单地使用predict(),因为我正在使用15个多重插补数据集(生成Amelia包) . 我在每个数据集上运行回归模型 . 然后,使用使用鲁宾规则的Amelia函数mi.meld()将结果组合成一组模型系数和标准误差 .

示例数据和代码:

dd<-list()
for (i in 1:15){
dd[[i]] <- data.frame(
  Age=runif(50,20,90),
  Cat=factor(sample(0:4, 50, replace=T)),
  Outcome = sample(0:1, 50, replace=T)
)}

b.out<-NULL
se.out<-NULL
for(i in 1:15) {
  ols.out<-glm(Outcome~Age+factor(Cat), data=dd[[i]],family="binomial")
  b.out <- rbind(b.out, ols.out$coef)
  se.out <- rbind(se.out, coef(summary(ols.out))[,2])}
mod0 <- mi.meld(q = b.out, se = se.out)

> mod0
$q.mi
     (Intercept)         Age factor(Cat)1 factor(Cat)2 factor(Cat)3 factor(Cat)4
[1,]   0.0466825 -0.00577106    0.5291908  -0.09760264    0.4058684    0.3125109

$se.mi
     (Intercept)        Age factor(Cat)1 factor(Cat)2 factor(Cat)3 
factor(Cat)4
[1,]    1.863276 0.02596468     1.604759     1.398322     1.414589     
1.332743

现在是问题部分 . 我想计算下列预测值集的预测值(在这种情况下,预测概率)和标准误差:

data.predict <- data.frame(Cat=as.factor(c(0:4)), Age=53.6)
print(data.predict)
  Cat  Age
1   0 53.6
2   1 53.6
3   2 53.6
4   3 53.6
5   4 53.6

如果我在1个数据集上安装了模型,我会这样做:

prediction<- predict(mod1, data.predict, type="response",se.fit=T)

但是,我没有模型对象,我只有系数存储..现在我已经研究了两种解决方法,第一种是以这种方式手动计算预测:predict() with arbitrary coefficients in r但是我不知道如何获得标准错误..我的另一个想法是创建一个假的模型对象,像这个函数创建:https://gist.github.com/MrFlick/ae299d8f3760f02de6bf并在predict()中使用它,但由于没有使用模型的标准错误,也有无法计算预测的标准误差..

有没有人有关于如何解决这个问题的建议?我试图用示例代码清楚地解释我的问题,但如果我的问题不明确,请告诉我,以便我可以提供其他信息 . 谢谢您的帮助!