我想在数据帧的变量中执行线性插值,其考虑:1)两点之间的时间差,2)获取数据的时刻和3)用于测量变量的个体 .
例如,在下一个数据帧中:
df <- data.frame(time=c(1,2,3,4,5,6,7,1,2,3),
Individuals=c(1,1,1,1,1,1,1,2,2,2),
Value=c(1, 2, 3, NA, 5, NA, 7, 5, NA, 7))
df
我想获得:
result <- data.frame(time=c(1,2,3,4,5,6,7,1,2,3),
Individuals=c(1,1,1,1,1,1,1,2,2,2),
Value=c(1, 2, 3, 4, 5, 6, 7, 5, 5.5, 6))
result
我不能专门使用包 zoo
的函数 na.approx
,因为所有观察都不是连续的,一些观察属于一个人而其他观察属于其他观察 . 原因是因为如果第二个人第一次使用 NA
并且我将专门使用函数 na.approx
,我将使用来自 individual==1
的信息来插入 individual==2
的 NA
(例如,下一个数据帧会有sucherror)
df_2 <- data.frame(time=c(1,2,3,4,5,6,7,1,2,3),
Individuals=c(1,1,1,1,1,1,1,2,2,2),
Value=c(1, 2, 3, NA, 5, NA, 7, NA, 5, 7))
df_2
我尝试使用包 zoo
和 dplyr
:
library(dplyr)
library(zoo)
proof <- df %>%
group_by(Individuals) %>%
na.approx(df$Value)
但是我无法在 zoo
对象中执行 group_by
.
你知道如何按组在一个变量中插入 NA
值吗?
提前致谢,
2 回答
使用
data.frame
而不是cbind
来创建数据 .cbind
返回一个矩阵,但您需要dplyr
的数据框 . 然后在mutate
内使用na.approx
. 我已经注释掉了group_by
,因为你没有将分组变量添加到数据框中 .我们可以用
data.table