从另一个变量（R，MICE）估算稀疏数据集-Java 学习之路

我有一个依赖时间序列变量（月水位）与第二个变量（月降水量）非常强相关 . 这可以通过分析我们有许多长期观察（n> 500）的位置来显示 . 就我的目的而言，它将假设因变量的变化等于自变量的变化 .

鉴于这种关系，我想预测降水已知的水位，但很少有历史观测水位......比如说n = 5左右 . 使用R中的MICE包，我随机选择长期水位数据的小子样本，并使用降水变量的z得分估算缺失的变量，没有丢失记录 .

mice(subset, method = "norm", maxit = 200)

当随机样本达到高于和低于平均值的良好观察范围时，它可以很好地（甚至令人惊讶地）很好地工作 . imputed data - n=5 - good fit

当随机样本只能在平均值的一侧进行观察时，一切都会变成地狱 . imputed data - n=5 - poor fit

我知道我可以通过增加n来改善拟合，但重点是尝试估算稀疏数据集 . 我觉得好像我在这种估算中遗漏了一些东西，这并没有完全说明预测变量是一组z分数，其中已经包含有关数据的均值和SD的信息 .

我想改进或约束插补，以便推算结果的z得分与降水z得分相似 .

MICE可能不是最好的方法，所以我愿意接受任何建议 .

从另一个变量（R，MICE）估算稀疏数据集