我想使用Random Forest方法来估算缺失值 . 我读过一些声称MICE随机森林比参数鼠标表现更好的论文 .
在我的情况下,我已经为默认鼠标运行了一个模型,并得到了结果并与它们一起玩 . 但是,当我有方法随机森林的选项,我得到一个错误,我不知道为什么 . 我已经看到一些与随机森林和老鼠的错误有关的问题,但那些不是我的情况 . 我的变量不止一个NA .
imp <- mice(data1, m=70, pred=quickpred(data1), method="pmm", seed=71152, printFlag=TRUE)
impRF <- mice(data1, m=70, pred=quickpred(data1), method="rf", seed=71152, printFlag=TRUE)
iter imp variable
1 1 Vac
Error in if (n == 0) stop("data (x) has 0 rows") : argument is of length zero
任何人都知道我为什么会收到这个错误?
EDIT
我试图将所有变量更改为数字而不是虚拟变量,它返回相同的错误和一些警告()
impRF <- mice(data, m=70, pred=quickpred(data), method="rf", seed=71152, printFlag=TRUE)
iter imp variable
1 1 Vac CliForm
Error in if (n == 0) stop("data (x) has 0 rows") : argument is of length zero
In addition: There were 50 or more warnings (use warnings() to see the first 50)
50: In randomForest.default(x = xobs, y = yobs, ntree = 1, ... :
The response has five or fewer unique values. Are you sure you want to do regression?
EDIT1
我只尝试了5个插补和一个较小的数据子集,只有2000行,并得到了一些不同的错误:
> imp <- mice(data2, m=5, pred=quickpred(data2), method="rf", seed=71152, printFlag=TRUE)
iter imp variable
1 1 Vac Radio Origin Job Alc Smk Drugs Prison Commu Hmless Symp
Error in randomForest.default(x = xobs, y = yobs, ntree = 1, ...) : NAs in foreign
function call (arg 11)
In addition: Warning messages:
1: In randomForest.default(x = xobs, y = yobs, ntree = 1, ...) : invalid mtry: reset to within valid range
2: In max(ncat) : no non-missing arguments to max; returning -Inf
3: In randomForest.default(x = xobs, y = yobs, ntree = 1, ...) : NAs introduced by coercion
1 回答
当我只有一个完全观察到的变量时,我也遇到了这个错误,我猜这也是你案例的原因 . 我的同事Anoop Shah为我提供了一个解决方案(下图),van Buuren教授(老鼠的作者)表示他将把它包含在下一次更新的包中 .
在R中键入以下内容,以便重新定义rf impute函数 . fixInNamespace(“mice.impute.rf”,“mice”)
修正后的粘贴功能是: