我有一个缺少值的数据集,我可以使用不同的方法来估算缺失的值 . 现在我想估计插补方法的准确性 . 但由于我不知道插补前的真实值是什么,我想在原始数据“缺少数据的数据”中屏蔽一些值,然后使用我的常规插补方法 . 完成插补后,我可以将插补值与真值进行比较,以估算插补精度 . 所以,我的问题是:假设我想将数据集中的100个元素分配为NA,如何选择100个不缺少的元素来为其分配NA . 那么,如何跟踪这些元素以进行进一步分析?
例
library(BLR)
library(missForest)
data(wheat)
X2<- prodNA(X, 0.1) ## original “ data with 10 % missing values
X3<- missForest(X2)$Ximp ## imputed data set
1 回答
此方法将确保准确拉出N个点,没有重复