我试图创建一个测试 data.frame 以展示我的问题,但我的容量还不够强,甚至不能做到这一点 . 我无法分享我真正的数据库 . 我希望我的问题可以独立存在 .

我正在使用嵌套的纵向数据集,该数据集保存为长文件(1000个主题嵌套在8个站点中,4个潜在时间点/主题,68个潜在预测变量) . 在对纵向结果进行lme之前,我想在4个静态预测因子(例如,母亲教育,家庭收入)上计算缺失值,以便为所有模型提供一致数量的病例 .

我正在使用r中的包鼠 . 从我读过的所有内容中,建议我使用模型中的所有变量以及可能预测插补中缺失值的任何其他变量 . 鉴于我的模型中的变量数量,我需要像quickpred这样的东西来简化它 . 但我收到一个我不明白的错误 .

我为我的数据库N2NPL尝试了以下初始代码,指出 c(14, 16, 18, 19) 是我想要预测的变量 .

iniN2NPL <- mice(N2NPL[,c(14,16,18,19)], pred= quickpred(N2NPL,
                 minpuc = 0.25, exclude = c('ID','TypeConvNon','TypeCtPr','TypeName','CHR_converter')),
                 maxit = 0)

“check.predictorMatrix(setup)中的错误:predictorMatrix有73行和73列 . 两者都应该是4'

我知道 mice::quickpred 需要是一个方阵,但不管怎么说都没有输入所有变量?考虑到站点内的主题嵌套,将站点作为预测器是否足够?

感谢您的任何帮助,指导我正确的代码或说明 . 我看到的例子看起来都比我的简单得多,因此对我遇到的问题几乎没有帮助 .