我尝试在mutate_()函数(dplyr)中使用paste()创建变量 .
我尝试用这个答案(dplyr - mutate: use dynamic variable names)调整代码,但它不起作用......
NB: nameVarPeriod1 is a param of a function .
nameVarPeriod1=A2
df <- df %>%
group_by(segment) %>%
mutate_((.dots=setNames(mean(paste0("Sum",nameVarPeriod1)), paste0("MeanSum",nameVarPeriod1))))
这会返回一个警告:
Warning message:
In mean.default(paste0("Sum", nameVarPeriod1)) :
argument is not numeric or logical: returning NA
如何评估paste0中的字符串作为变量名?
当我用这个替换paste0时它工作正常:
df <- df %>%
group_by(segment) %>%
mutate(mean=mean(SumA2))
DATA :
structure(list(segment = structure(c(5L, 1L, 4L, 2L, 2L, 14L,
11L, 6L, 14L, 1L), .Label = c("Seg1", "Seg2", "Seg3", "Seg4",
"Seg5", "Seg6", "Seg7", "Seg8", "Seg9", "Seg10", "Seg11", "Seg12",
"Seg13", "Seg14"), class = "factor"), SumA2 = c(107584.9, 127343.87,
205809.54, 138453.4, 24603.46, 44444.39, 103672, 88695.8, 64400,
36815.82)), .Names = c("segment", "SumA2"), row.names = c(NA,
-10L), class = c("tbl_df", "tbl", "data.frame"))
2 回答
dplyr 0.7.0
以后不需要使用mutate_
. 这是一个使用:=
动态分配变量名和辅助函数的解决方案quo name
.有关详细信息,请阅读
vignette("programming", "dplyr")
会很有帮助 . 有关旧版本的dplyr,另请参阅dplyr - mutate: use dynamic variable names .不确定使用原始列名重命名汇总列名称的目的是什么 . 但是,如果您正在寻找一个解决方案,您想拥有多列的
sum
,因此想要重命名那些dplyr::mutate_at
为您做到了 .