我有一个依赖时间序列变量(月水位)与第二个变量(月降水量)非常强相关 . 这可以通过分析我们有许多长期观察(n> 500)的位置来显示 . 就我的目的而言,它将假设因变量的变化等于自变量的变化 .

鉴于这种关系,我想预测降水已知的水位,但很少有历史观测水位......比如说n = 5左右 . 使用R中的MICE包,我随机选择长期水位数据的小子样本,并使用降水变量的z得分估算缺失的变量,没有丢失记录 .

mice(subset, method = "norm", maxit = 200)

当随机样本达到高于和低于平均值的良好观察范围时,它可以很好地(甚至令人惊讶地)很好地工作 . imputed data - n=5 - good fit

当随机样本只能在平均值的一侧进行观察时,一切都会变成地狱 . imputed data - n=5 - poor fit

我知道我可以通过增加n来改善拟合,但重点是尝试估算稀疏数据集 . 我觉得好像我在这种估算中遗漏了一些东西,这并没有完全说明预测变量是一组z分数,其中已经包含有关数据的均值和SD的信息 .

我想改进或约束插补,以便推算结果的z得分与降水z得分相似 .

MICE可能不是最好的方法,所以我愿意接受任何建议 .