首页 文章

尝试估算多级数据时鼠标出错

提问于
浏览
3

我一直在努力解决 mice 中的一个问题,试图在两个级别上丢失数据的多级数据 . 我花了一些时间,但我终于设法重新创建错误,这似乎发生在 mice 尝试在 sampler 函数中创建记录事件时 . 我有一个变量指示测试版本,但仅与第一次测量相关(之后它是常量) . 这个变量似乎导致错误 .

当使用 "2lonly.pmm" 作为变量的插补方法 mice 时返回错误: Error in get("state", parent.frame(frame)) : object 'state' not found 使用任何其他方法不会导致错误 . 通常 mice 会创建一个记录事件,表明从插补过程中删除了变量(或某个因子的某个级别) . 但不知何故,当方法为 "2lonly.pmm" 时,它不会创建记录的事件 . 非常感谢您解决此问题的任何帮助

这是 mice.impute.2lonly.pmm 帮助页面中的数据集:

G <- 250            # number of groups
n <- 20             # number of persons
beta <- .3          # regression coefficient
rho <- .30          # residual intraclass correlation
rho.miss <- .10     # correlation with missing response
missrate <- .50     # missing proportion
y1 <- rep( rnorm( G , sd = sqrt( rho ) ) , each=n ) + rnorm(G*n , sd = sqrt( 1 - rho )) 
w <- rep( round( rnorm(G ) , 2 ) , each=n )
v <- rep( round( runif( G , 0 , 3 ) ) , each=n )
x <-  rnorm( G*n ) 
y <- y1 + beta  * x + .2 * w + .1 * v
dfr0 <- dfr <- data.frame( "group" = rep(1:G , each=n ) , "x" = x , "y" = y , "w" = w , "v" = v )
dfr[ rho.miss * x + rnorm( G*n , sd = sqrt( 1 - rho.miss ) ) < qnorm( missrate ) , "y" ] <- NA
dfr[ rep( rnorm(G) , each=n ) < qnorm( missrate ) , "w" ] <- NA
dfr[ rep( rnorm(G) , each=n ) < qnorm( missrate ) , "v" ] <- NA

这是创建错误的变量类型的再创造

dfr$test <- rep(1:20,length(unique(dfr$group)))
dfr$version[dfr$test == 1]<- sample(0:2,length(unique(dfr$group)),replace = T)
dfr$version[dfr$test > 1]<- 3 # test

和归责过程

# empty mice imputation
imp0 <- mice(dfr  , maxit=0 )
predM <- imp0$predictorMatrix # Predictor matrix
impM <- imp0$method # Method

#...
# multilevel imputation
predM[c("y","v"),"group"] <- -2 # indicate grouping variable
impM[c("y","w","v")] <- c("2l.pan" , "pmm" , "2lonly.pmm" )


# y ... imputation using 2l.pan
# w ... imputation at level 2 using pmm
# v ... imputation at level 2 using 2lonly.pmm

imp <- mice(dfr, m = 1, pred = predM , 
            method= impM, maxit = 1)

我正在使用 mice 版本3.0.0和R 3.5.0

1 回答

  • 1

    我在GitHub询问了包装的设计者,显然这是老鼠v3.0.0中的一个错误 . 在这个版本中可以通过将方法更改为岭回归来解决这个问题: ls.meth = "ridge" 在结果中引入一个小偏差的缺点 .

    设计人员在可以使用安装的更新(v3.0.9)中修复了这个错误

    devtools::install_github(repo = "stefvanbuuren/mice")
    

    希望这可以帮助遇到同样问题的人 .

相关问题