我想计算预测值和标准误差,但我不能简单地使用predict(),因为我正在使用15个多重插补数据集(生成Amelia包) . 我在每个数据集上运行回归模型 . 然后,使用使用鲁宾规则的Amelia函数mi.meld()将结果组合成一组模型系数和标准误差 .
示例数据和代码:
dd<-list()
for (i in 1:15){
dd[[i]] <- data.frame(
Age=runif(50,20,90),
Cat=factor(sample(0:4, 50, replace=T)),
Outcome = sample(0:1, 50, replace=T)
)}
b.out<-NULL
se.out<-NULL
for(i in 1:15) {
ols.out<-glm(Outcome~Age+factor(Cat), data=dd[[i]],family="binomial")
b.out <- rbind(b.out, ols.out$coef)
se.out <- rbind(se.out, coef(summary(ols.out))[,2])}
mod0 <- mi.meld(q = b.out, se = se.out)
> mod0
$q.mi
(Intercept) Age factor(Cat)1 factor(Cat)2 factor(Cat)3 factor(Cat)4
[1,] 0.0466825 -0.00577106 0.5291908 -0.09760264 0.4058684 0.3125109
$se.mi
(Intercept) Age factor(Cat)1 factor(Cat)2 factor(Cat)3
factor(Cat)4
[1,] 1.863276 0.02596468 1.604759 1.398322 1.414589
1.332743
现在是问题部分 . 我想计算下列预测值集的预测值(在这种情况下,预测概率)和标准误差:
data.predict <- data.frame(Cat=as.factor(c(0:4)), Age=53.6)
print(data.predict)
Cat Age
1 0 53.6
2 1 53.6
3 2 53.6
4 3 53.6
5 4 53.6
如果我在1个数据集上安装了模型,我会这样做:
prediction<- predict(mod1, data.predict, type="response",se.fit=T)
但是,我没有模型对象,我只有系数存储..现在我已经研究了两种解决方法,第一种是以这种方式手动计算预测:predict() with arbitrary coefficients in r但是我不知道如何获得标准错误..我的另一个想法是创建一个假的模型对象,像这个函数创建:https://gist.github.com/MrFlick/ae299d8f3760f02de6bf并在predict()中使用它,但由于没有使用模型的标准错误,也有无法计算预测的标准误差..
有没有人有关于如何解决这个问题的建议?我试图用示例代码清楚地解释我的问题,但如果我的问题不明确,请告诉我,以便我可以提供其他信息 . 谢谢您的帮助!