首页 文章

R:按组插入NA

提问于
浏览
2

我想在数据帧的变量中执行线性插值,其考虑:1)两点之间的时间差,2)获取数据的时刻和3)用于测量变量的个体 .

例如,在下一个数据帧中:

df <- data.frame(time=c(1,2,3,4,5,6,7,1,2,3),
            Individuals=c(1,1,1,1,1,1,1,2,2,2),
            Value=c(1, 2, 3, NA, 5, NA, 7, 5, NA, 7))
  df

我想获得:

result <- data.frame(time=c(1,2,3,4,5,6,7,1,2,3),
                Individuals=c(1,1,1,1,1,1,1,2,2,2),
                Value=c(1, 2, 3, 4, 5, 6, 7, 5, 5.5, 6))
 result

我不能专门使用包 zoo 的函数 na.approx ,因为所有观察都不是连续的,一些观察属于一个人而其他观察属于其他观察 . 原因是因为如果第二个人第一次使用 NA 并且我将专门使用函数 na.approx ,我将使用来自 individual==1 的信息来插入 individual==2NA (例如,下一个数据帧会有sucherror)

df_2 <- data.frame(time=c(1,2,3,4,5,6,7,1,2,3),
                Individuals=c(1,1,1,1,1,1,1,2,2,2),
                Value=c(1, 2, 3, NA, 5, NA, 7, NA, 5, 7))
  df_2

我尝试使用包 zoodplyr

library(dplyr)
library(zoo)
proof <- df %>%
  group_by(Individuals) %>%
  na.approx(df$Value)

但是我无法在 zoo 对象中执行 group_by .

你知道如何按组在一个变量中插入 NA 值吗?

提前致谢,

2 回答

  • 3

    使用 data.frame 而不是 cbind 来创建数据 . cbind 返回一个矩阵,但您需要 dplyr 的数据框 . 然后在 mutate 内使用 na.approx . 我已经注释掉了 group_by ,因为你没有将分组变量添加到数据框中 .

    df <- data.frame(time=c(1,2,3,4,5,6,7,1,2,3),
                Individuals=c(1,1,1,1,1,1,1,2,2,2),
                Value=c(NA, 2, 3, NA, 5, NA, 7, 8, NA, 10))
    
    library(dplyr)
    library(zoo)
    
    df %>%
      group_by(Individuals) %>%
      mutate(ValueInterp = na.approx(Value, na.rm=FALSE))
    
       time Individuals Value ValueInterp
    1     1           1    NA          NA
    2     2           1     2           2
    3     3           1     3           3
    4     4           1    NA           4
    5     5           1     5           5
    6     6           1    NA           6
    7     7           1     7           7
    8     1           2     8           8
    9     2           2    NA           9
    10    3           2    10          10
    
  • 3

    我们可以用 data.table

    library(data.table)
    library(zoo)
    setDT(df1)[, ValueInterp:= na.approx(Value, na.rm=TRUE), by = Individual]
    

相关问题