我一直在努力解决 mice
中的一个问题,试图在两个级别上丢失数据的多级数据 . 我花了一些时间,但我终于设法重新创建错误,这似乎发生在 mice
尝试在 sampler
函数中创建记录事件时 . 我有一个变量指示测试版本,但仅与第一次测量相关(之后它是常量) . 这个变量似乎导致错误 .
当使用 "2lonly.pmm"
作为变量的插补方法 mice
时返回错误: Error in get("state", parent.frame(frame)) : object 'state' not found
使用任何其他方法不会导致错误 . 通常 mice
会创建一个记录事件,表明从插补过程中删除了变量(或某个因子的某个级别) . 但不知何故,当方法为 "2lonly.pmm"
时,它不会创建记录的事件 . 非常感谢您解决此问题的任何帮助
这是 mice.impute.2lonly.pmm
帮助页面中的数据集:
G <- 250 # number of groups
n <- 20 # number of persons
beta <- .3 # regression coefficient
rho <- .30 # residual intraclass correlation
rho.miss <- .10 # correlation with missing response
missrate <- .50 # missing proportion
y1 <- rep( rnorm( G , sd = sqrt( rho ) ) , each=n ) + rnorm(G*n , sd = sqrt( 1 - rho ))
w <- rep( round( rnorm(G ) , 2 ) , each=n )
v <- rep( round( runif( G , 0 , 3 ) ) , each=n )
x <- rnorm( G*n )
y <- y1 + beta * x + .2 * w + .1 * v
dfr0 <- dfr <- data.frame( "group" = rep(1:G , each=n ) , "x" = x , "y" = y , "w" = w , "v" = v )
dfr[ rho.miss * x + rnorm( G*n , sd = sqrt( 1 - rho.miss ) ) < qnorm( missrate ) , "y" ] <- NA
dfr[ rep( rnorm(G) , each=n ) < qnorm( missrate ) , "w" ] <- NA
dfr[ rep( rnorm(G) , each=n ) < qnorm( missrate ) , "v" ] <- NA
这是创建错误的变量类型的再创造
dfr$test <- rep(1:20,length(unique(dfr$group)))
dfr$version[dfr$test == 1]<- sample(0:2,length(unique(dfr$group)),replace = T)
dfr$version[dfr$test > 1]<- 3 # test
和归责过程
# empty mice imputation
imp0 <- mice(dfr , maxit=0 )
predM <- imp0$predictorMatrix # Predictor matrix
impM <- imp0$method # Method
#...
# multilevel imputation
predM[c("y","v"),"group"] <- -2 # indicate grouping variable
impM[c("y","w","v")] <- c("2l.pan" , "pmm" , "2lonly.pmm" )
# y ... imputation using 2l.pan
# w ... imputation at level 2 using pmm
# v ... imputation at level 2 using 2lonly.pmm
imp <- mice(dfr, m = 1, pred = predM ,
method= impM, maxit = 1)
我正在使用 mice
版本3.0.0和R 3.5.0
1 回答
我在GitHub询问了包装的设计者,显然这是老鼠v3.0.0中的一个错误 . 在这个版本中可以通过将方法更改为岭回归来解决这个问题:
ls.meth = "ridge"
在结果中引入一个小偏差的缺点 .设计人员在可以使用安装的更新(v3.0.9)中修复了这个错误
希望这可以帮助遇到同样问题的人 .