首页 文章
  • 0 votes
     answers
     views

    R(dplyr):组内的滞后值

    我想计算起始值和滞后结束值之间的比较 . 此比较应仅在某个组(起始值)内进行 . 如果此组中没有先前的“结束”值,则比较值应为NA . 这是我的数据: library(dplyr) dfData <- data.frame( start = c(100, 239, 392, 700, 770), end = c...
  • 2 votes
     answers
     views

    存储在变量中的dplyr concat列(变异和非标准评估)

    我想基于变量 cols_to_concat 连接数据帧中的任意数量的列 df <- dplyr::data_frame(a = letters[1:3], b = letters[4:6], c = letters[7:9]) cols_to_concat = c("a", "b", "c") 要使用 cols_to_concat...
  • 0 votes
     answers
     views

    R dplyr rowMeans with filter

    我看过几篇关于将rowMeans类型的结果变为mutate的帖子 . 例如和dplyr - using mutate() like rowmeans() - 但我想让另一个变量充当过滤器 . 据我所知,这些数据并不整齐,“f#”和“d#”变量可以重新整形,然后转换为“f”和“d”,然后过滤“f”并汇总“d” . 但有没有办法在不重塑的情况下做到这一点?我设计了下面的代码 library(tidy...
  • 1 votes
     answers
     views

    dplyr根据向量中的名称改变多个列

    我想通过使用 dplyr's mutate 函数将两列相互相乘 . 但是,我不想为每个mutate条件写一个新行,而是使用存储在向量 var1 和 var2 中的列的名称 . 例如,最后我想在现有的 bankdata 中添加一个名为 result1 的列,其中包含将现金和贷款列相互叠加的结果 . 这将持续到创建3个新列 . 可重现的代码: bankname <- c("Bank A...
  • 1 votes
     answers
     views

    使用dplyr mutate获取唯一值的cumsum

    虚拟数据集是: data <- data.frame( id = c(1,1,2,2,3,4,5,6), value = c(10,10,20,20,10,30,40,50), other = c(1,2,3,4,5,6,7,8) ) 数据是 dplyr 管道中 group_by(id) 操作的输出 . 每个 id 最多与一个值相关联,而两个不同的 id 可以具有相同的值 . ...
  • 0 votes
     answers
     views

    具有滞后函数的Dplyr变异忽略NA值

    我想在数据框上创建一个新列(Ifl_10min_mm.h),其值是前一行和实际行的总和 . 我正在使用dplyr包,具有mutate和lag功能 . 当尝试将实际行值与先前的NA行值相加时,结果输出为NA . 如何避免NA输出? library(dplyr) df = read.csv(file= "prueba3.csv ",header=TRUE,sep= ",&...
  • 1 votes
     answers
     views

    在mutate()中使用lag来为已创建的列前滚滚动值

    我试图在点击流数据中指定会话 . 我根据months和userId对行进行分组,并尝试创建另一个变量会话,该会话查看diff_days列,如果那个> 0.00209则增加,否则保持为先前的值 . 所以基本上我正在尝试创建会话变量并同时使用滞后版本 . 组中的第一行始终是session = 1 . 例如,这个数据是group_by中的一个组: ID Month diff_days 2 0...
  • 1 votes
     answers
     views

    匹配一行中包含多个条目的列并改变结果

    我有一个数据框: col_1 <- c("A", "A", "B", "B", "C", "C") col_2 <- c("A", "B", "C", "D", "E"...
  • 2 votes
     answers
     views

    如何使用mutate按行创建变量应用函数

    我有一个数据框,我想创建一个新的变量应用一个在行内工作的函数 . 请参阅下面的示例 . library(tidyverse) n <- 100 z0 <- data.frame(A = sample(c("y","n",NA), n, replace = T, prob = c(.4,.4,.1)), B = ...
  • 0 votes
     answers
     views

    使用条件将列变为单独的数据框

    我想使用条件在mutate的管道末尾添加新列 into another data frame . 如果变量的长度为零,则在列中添加短划线,否则添加内容 . 这是我绑定结果数据帧的循环的一部分,因此所有列表只有一个项目,这里的数据帧只有一行 . 是否可以使用mutate将列添加到除管道中使用的数据框之外的数据框中? 我尝试使用我在这里找到的提示来解决这个问题:Combine mutate with...
  • 0 votes
     answers
     views

    R - Dplyr - 如何改变行

    我发现dplyr对于聚合和汇总数据来说是快速而简单的 . 但我无法找到如何用dplyr解决以下问题 . 鉴于这些数据框架: df_2017 <- data.frame(expand.grid(1:195,1:65,1:39), value = sample(1:1000000,(195*65*39)), ...
  • 1 votes
     answers
     views

    如何在dplyr和purrr中生成具有特定模式的多个列而不是使用循环? [重复]

    这个问题在这里已有答案: Mutate multiple / consecutive columns (with dplyr or base R) 2个答案 Mutating multiple columns in a data frame using dplyr 4个答案 我想基于data.frame中的当前变量信息生成多个新列(例如,这里的数据),我可以使用下面列出的脚本生成带有循...
  • 0 votes
     answers
     views

    使用mutate从命名向量输出值

    我有1X2数据帧,其值为'sent1'和'sent2' . test.df <- data.frame(sentence = c('sent1', 'sent2')) 我还有一个参考向量,其中包含2个句子和3个类别(a,b,c)组合的值 . test.vec <- c(sent1_a = 1, sent1_b = 0, sent1_c = 1,...
  • 0 votes
     answers
     views

    R dplyr :: mutate,ifelse以全局变量为条件,从第一行开始循环

    我很好奇为什么 dplyr::mutate() 调用中的 ifelse() 语句似乎只适用于我的数据帧的第一行 . 这将返回单个值,该值将在整个列中循环使用 . 由于在 ifelse() 的任何一种情况下评估的表达式仅在我的数据框的上下文中有效,我希望条件检查和结果表达式评估作为一个整体在列上执行,而不仅仅是它们的第一个元素 . 这是一个例子:我在数据框外定义了一个名为 checkVar 的变量 ...
  • 1 votes
     answers
     views

    分位数在数据帧的多列上排名并改变结果

    我有一个数据框,如下所示: AA BB CC DD aa 2.6 -0.3 2.5 2.3 bb -0.3 1.2 2.1 0.8 cc 0.5 -0.4 0.4 0.4 我想基于每个列对此数据框执行分位数排名,并将每列的排名变为数据框 . 我想用dplyr包 . 我可以为一列生成以下数据框: AA BB CC DD quantile aa 2.6 -0.3 2.5...
  • 1 votes
     answers
     views

    R dplyr rowwise mutate

    大家早上好,这是我第一次发布堆栈溢出 . 感谢您的任何帮助! 我有2个数据帧用于分析库存数据 . 一个数据框有其他信息的日期,我们可以称之为df: df1 <- tibble(Key = c('a','b','c'), i =11:13, date= ymd(20110101:20110103)) 第二个数据框还有日期和其他重要信息 . df2 <-tibble(Answer = c...
  • 3 votes
     answers
     views

    你能使dplyr :: mutate和dplyr :: lag默认=它自己的输入值吗?

    这类似于this dplyr lag post和this dplyr mutate lag post,但这些都没有提出关于默认为输入值的问题 . 我正在使用dplyr来改变_325927已经转换为POSIXct的新字段 . 目标是,对于给定的ip,我想知道一些关于它在我的列表中显示的所有时间之间的增量的汇总统计数据 . 我也有大约1200万行 . 数据看起来像这样(在变异之前) ip ...
  • 1 votes
     answers
     views

    将函数应用于匹配多行的组

    我正在尝试向我的df添加一个新列,这只是我的函数hardfunct应用于'values',其中行是'hardness' . 然后,我希望该值填充该列中匹配'site'和'dates'的所有行 . 如何填充其余行?我尝试过使用summary,rowwise和mutate . 样本数据如下 . site=c(rep("River A",4),rep("River B&qu...
  • 1 votes
     answers
     views

    在data.table,R中,“dplyr Mutate”的等价物是什么?

    目标数据表如下: #DT NO GROUP KEY TYPE <--- Create this column 12-19 N 1701 INN 10-20 N 1602 INN 13 P 1501John BANK 14 R 1408Mary POOL 1...
  • 3 votes
     answers
     views

    使用group_by时mutate_at评估错误

    mutate_at()显示与group_by()一起使用时以及将列位置的数字向量作为第一个(.vars)参数进行插入时的评估错误 . 使用 R 3.4.2和 dplyr 0.7.4版本时出现问题 使用 R 3.3.2和 dplyr 0.5.0时工作正常 如果.vars是字符向量(列名),则工作正常 例: # Create example dataframe Id <-...
  • 2 votes
     answers
     views

    R - 创建几列非零最小值的新列

    我正在尝试使用 tidyverse 和 dplyr 创建一个新列,该列是多个其他列的行的非零最小值,如果所有列都为0,则为0 . 简化示例: df <- data.frame( aa = c(0, 0, 0), bb = c(0, 1, 2), cc = c(2, 5, 3) ) 新列应该是2,1和2.以下代码适用于这种情况,但对于较大的data.frames来说速度非常慢 ....
  • 1 votes
     answers
     views

    在dplyr :: mutate中嵌套的ifelse调用为每行返回相同的值

    亲爱的stackoverflow社区, 我仍然是R的初学者,遇到了以下问题,我无法在stackoverflow或更广泛的网络上找到解决方案 . 对我来说似乎很直接,但我不知道我错过了什么或者我违反了哪些编码约定 . 下面的问题是更大功能的一部分,但下面的示例再现了该问题 . 我有两个数据框a和b,并希望在使用嵌套ifelse语句的情况下创建一个新变量foo1,其中条件基于a和b中的元素 . a &...
  • 4 votes
     answers
     views

    如何在mutate(dplyr)中使用自定义函数?

    我正在使用dplyr重写我的所有代码,并需要mutate / mutate_at函数的帮助 . 我只需要将自定义函数应用于表格中的两列 . 理想情况下,我会通过它们的索引引用这些列,但现在我甚至无法通过名称引用它 . 功能是: binom.test.p <- function(x) { if (is.na(x[1])|is.na(x[2])|(x[1]+x[2])<10) { ...
  • 0 votes
     answers
     views

    dplyr mutate的复杂条件

    样本数据: library(dplyr) id <- rep(LETTERS[1:5], each = 10) x <- round(runif(50, -500, 200), digits = 0) y <- round(runif(50, -700, 700), digits = 0) z <- round(runif(50, 250, 300), digits = ...
  • 1 votes
     answers
     views

    dplyr mutuate仅在不同的列==特定值时添加新列值

    我有一个具有以下结构的数据框(摘要示例,不是实际的) dput(df1) structure(list(MedID = c(111, 111, 111, 111, 111, 111, 222, 222, 222, 222, 222), Service = structure(c(1L, 1L, 2L, 1L, 1L, 3L, 3L, 2L, 1L, 1L, 3L), .Label = c(&q...
  • 0 votes
     answers
     views

    从r中的列表中变换多个数据帧的列

    我有一个包含12个data.frames的列表: m =list(X2016_kvish_1_10t, X2015_kvish_1_10t, X2014_kvish_1_10t, X2013_kvish_1_10t, X2012_kvish_1_10t, X2011_kvish_1_10t, X2010_kvish_1_10t, X2009_kvish_1_10t, X200...
  • 2 votes
     answers
     views

    根据列类有条件地改变列

    我的问题是基于此处发布的上一个主题:Mutating multiple columns in a data frame 假设我有一个如下的反复: id char_var_1 char_var_2 num_var_1 num_var_2 ... x_var_n 1 ... ... ... ... ....
  • 3 votes
     answers
     views

    dplyr或矢量化方法中的动态变量评估

    通常情况下,我会通过运行一个循环来处理这类问题(可能还不是最好的解决方案),但我正在处理一个非常大的数据集(780万个观测值),并且我一直在尝试更有效地编程它 . 这是我的数据集的一个非常小的子集: df = data.frame(STATE = c("PA", "PA", "MD","MD", "MO&qu...
  • 125 votes
     answers
     views

    dplyr包可以用于条件变异吗?

    当突变是有条件的(取决于某些列值的值)时,是否可以使用mutate? 这个例子有助于显示我的意思 . structure(list(a = c(1, 3, 4, 6, 3, 2, 5, 1), b = c(1, 3, 4, 2, 6, 7, 2, 6), c = c(6, 3, 6, 5, 3, 6, 5, 3), d = c(6, 2, 4, 5, 3, 7, 2, 6), e = c(1,...
  • 9 votes
     answers
     views

    如何使用purrr中的map与dplyr :: mutate基于列对创建多个新列

    我必须使用R来关注问题 . 简而言之,我想基于数据框中不同列对的计算在数据帧中创建多个新列 . 数据如下: df <- data.frame(a1 = c(1:5), b1 = c(4:8), c1 = c(10:14), a2 = c(9:13), ...

热门问题