我试图根据下面的代码使用另一个相关变量填充变量中的NAs .
test <- tibble(x = c(1,4,3,2,5,6), y = c(2,NA,6,NA,NA,5))
test <- test %>% mutate(chng = x/lag(x,1))
for(i in 1:nrow(test)){
if(is.na(test$y[i])) test$y[i] <- test$y[i - 1] * test$chng[i]
}
我可以在dplyr中执行相同的操作吗?我已经尝试过行,但它似乎无法识别滞后函数 .
test %>% rowwise() %>% mutate(y = ifelse(is.na(y), lag(y,1) * chng, y))
连续多个NAs也阻止我创建一个由滞后变量组成的新列 .
2 回答
您可以重复
dplyr
操作,直到所有NA
都被填充:不过,我很确定这不会让你获得任何计算时间的效率 .
它不起作用,因为在行中,您在一行的子集上使用滞后 . 在进入rowwise模式之前创建一个新的y.lag列将起作用: