首页 文章
  • 1 votes
     answers
     views

    使用列表中包含的一些但不是所有字符串的多个模式提取和组合多个子字符串并返回到R中的列表

    我想找到一种优雅且易于操作的方式: 从包含为列表元素的一些(但不是全部)字符串中提取多个子字符串(每个列表元素只包含一个长字符串) 用这些多个子串替换相应的原始长字符串 将每个列表元素中的子字符串折叠为1个字符串 返回包含替换子字符串和未触及的长字符串的相同长度的列表 . 这个问题是我之前提出的问题的后续(虽然不同):replace strings of some list e...
  • 1 votes
     answers
     views

    tapply - 创建NA?

    我正在尝试计算每人独特水果的平均数量(我的惯常做法数据) . 这适用于以下两行代码: with(df, tapply(fruit, names, FUN = function(x) length(unique(x))))->uniques sum(uniques)/length(unique(df$names)) aggregate(df[,"fruit"], by=l...
  • 2 votes
     answers
     views

    Dplyr group_by日期

    我很困惑dplyr group_by函数如何处理Date对象 . 这是一个按预期工作的示例 . library(data.table); library(dplyr); library(lubridate) DT <- data.table(A = sample(1:100,12), B = (c("7-1-2015", "7-2-2015", &...
  • 3 votes
     answers
     views

    获取所有可能答案的R频率计数

    我从R开始,我仍然在寻找语法 . 我希望得到一个比例变量的频率,其值为0到10和NA . Id <- c(1,2,3,4,5) ClassA <- c(1,NA,3,1,1) ClassB <- c(2,1,1,3,3) R <- c(5,5,7,NA,9) S <- c(3,7,NA,9,5) df <- data.frame(Id,ClassA,ClassB...
  • 32 votes
     answers
     views

    在R中的数据帧的每一行上执行plyr操作

    我喜欢plyr语法 . 任何时候我必须使用* apply()命令之一,我最终踢狗并进行为期3天的弯曲 . 因此,为了我的狗和我的肝脏,在数据帧的每一行上执行ddply操作的简洁语法是什么? 这是一个适用于简单案例的示例: x <- rnorm(10) y <- rnorm(10) df <- data.frame(x,y) ddply(df,names(df) ,function...
  • 1 votes
     answers
     views

    如何在使用ddply时检索全局索引?

    我试图从 plyr 包中的Diamonds数据集中找到价格/克拉的最佳交易 所以我做到了 new = ddply(diamonds, c("cut", "color", "clarity"), transform, ecart= price/carat - mean(price/carat)) best = ddply(n...
  • 1 votes
     answers
     views

    ddply多个函数参数命名

    浏览其他问题我几乎解决了我的问题,但在最后一道障碍失败了...... 用R 我有一个数据帧(d),我通过plyr包中的ddply传递一个函数(fd),这会返回一个预期的数据帧 . 在我的实际数据帧中,我想要传递给函数的大量变量,而不是多次调用它,我还想给输出数据表赋予相关的col.names . 试图一步一步地做下面的工作...... 样本数据: d<-structure(list(date...
  • 2 votes
     answers
     views

    在我的软件包中使用ddply时,如何摆脱R CMD检查生成的NOTE?

    我有一个与How can I handle R CMD check "no visible binding for global variable" notes when my ggplot2 syntax is sensible?相似但又不同的问题 . 在那种情况下,通过使用aes_string而不是aes,一切都顺利进行 . 然而,这与plyr afaik无法实现 . 例如...
  • 0 votes
     answers
     views

    R ddply dcast替代?

    我想将数据(data.frame)从长格式转换为宽格式,并将“ITEM”的值作为列和值(“ITEM2”)(见下文): 长格式: 宽幅: 因此我使用包reshape2中的dcast函数: df <= dcast(df,SEQUENCEID + EVENTID ~ ITEM, value.var="ITEM2") 这样做一切正常 . 但是在我的数据框中有7m的数据记录,...
  • 0 votes
     answers
     views

    从plyr的ddply(或类似功能)中保存临时ouptut

    我有一个包含多个条件和参与者的大型数据集 . 我正在使用ddply,这样对于参与者X条件的每个组合,我可以运行许多函数并保存最终输出 . 由于从感兴趣的包中实施各种功能需要一些时间,因此整个分析可能需要1-2周 . 因此,我不仅希望等待ddply函数将最终输出保存在单个数据帧中,而且还希望保存临时输出,以防计算机崩溃,从而保存到目前为止完成的工作(即一种备份) . 例如,如果ddply函数在计算机...
  • 37 votes
     answers
     views

    ddply错误的含义:'names' attribute [9]的长度必须与vector [1]的长度相同

    我正在通过黑客机器学习,我被困在这一行: from.weight <- ddply(priority.train, .(From.EMail), summarise, Freq = length(Subject)) 这会产生以下错误: Error in attributes(out) <- attributes(col) : 'names' attribute [9] must...
  • 16 votes
     answers
     views

    当我在`dplyr`之后加载`plyr`时,为什么汇总或变异不能用于group_by?

    注意:此问题的 Headers 已经过编辑,以便在 plyr 函数掩盖其 dplyr 对应项时将其作为问题的规范问题 . 问题的其余部分保持不变 . 假设我有以下数据: dfx <- data.frame( group = c(rep('A', 8), rep('B', 15), rep('C', 6)), sex = sample(c("M", "F...
  • 1 votes
     answers
     views

    计算组内的实例(子集)

    我为我的数据做了一个小例子: mth <- c(rep(1,10)) day <- c(rep(10,5),rep(11,5)) hr <- c(3,4,5,6,7,3,4,5,6,7) v <- c(3,4,5,4,3,3,4,5,4,3) A <- data.frame(cbind(mth,day,hr,v)) 我需要做的是每天获得多少值<...
  • 6 votes
     answers
     views

    组内插值

    目标 我想在数据帧中的组内插值 . 这将为数据帧中的每个组提供任意数量的中间点 . 最小的工作示例 我有一个数据框,如: OldDataFrame <- data.frame(ID = c(1,1,1,2,2,2), time = c(1,2,3,1,2,3), Var1 = c(...
  • 46 votes
     answers
     views

    如何在每个组中创建滞后变量?

    我有一个data.table: set.seed(1) data <- data.table(time = c(1:3, 1:4), groups = c(rep(c("b", "a"), c(3, 4))), value = rnorm(7)) data # grou...
  • 1 votes
     answers
     views

    将数据集分组为时间间隔,然后计算每个时间段内的许多列

    我的数据集来自过程控制系统,其中包含由逻辑交换功能创建的各种数字输入(记录为“报警”) . 每个事件将输入的状态从0更改为1,在数据集中记录为“N”或“Y”字符,因此: tstamp alarm0 alarm1 alarm2 alarm3 alarm4...alarm204 2015-10-01 16:23:06 N N N N...
  • 5 votes
     answers
     views

    使用dplyr从不同的data.frame中提取数据?

    我有一个名为dat_new的数据框,基本上是诊所访问数据,hrn是患者ID,而dov是访问日期(每人多次访问) . 然后我有一个名为事件的数据框,其中有过期的住院(每人多次入院) . 我想做的是,对于每次门诊就诊,我想总结在门诊就诊之前发生的住院,简单 . 这适用于plyr的ddply,需要一点时间但效果很好 . temp <- ddply(dat_new, .(hrn,dov), summ...
  • 81 votes
     answers
     views

    dplyr总结:相当于“ . drop = FALSE”以保持输出中长度为零的组

    使用 summarise 和 plyr 的 ddply 函数时,默认情况下会删除空类别 . 您可以通过添加 .drop = FALSE 来更改此行为 . 但是,当 summarise 与 dplyr 一起使用时,这不起作用 . 还有另一种方法可以在结果中保留空类别吗? 这是假数据的一个例子 . library(dplyr) df = data.frame(a=rep(1:3,4), b=rep(...
  • 4 votes
     answers
     views

    R中的ddply:对于每个组,查找特定变量的出现百分比

    我有一个数据集,其中包含两列,user_type和滞后响应时间(以天为单位): user_type imp_date lag Consumer 20130613 1 Consumer 20130612 2 Consumer 20130611 3 Consumer 20130612 ...
  • 0 votes
     answers
     views

    在另一个函数中定义聚合函数时出现ddply错误

    以下几乎最小代码的要点是在函数f中应用ddply,其中ddply的聚合函数(helper)在f的定义中是自定义的 . 不幸的是,我不明白为什么采购整个代码段会产生eval中的错误(expr,envir,enclos):找不到函数"helper" . 当辅助函数独立于函数f运行时,代码有效 . 当我用 by 的未注释调用替换 ddply 调用时,代码运行没有错误 . 您能解释错误...
  • 1 votes
     answers
     views

    具有ddply的面板中的滞后变量

    我试图在实质上是面板数据集中生成精度变化(基于估计的置信区间) . 因此,作为一个简单的例子,这里是我编写的函数并将其应用于非感性示例.... precision.gain <- function(x){ x <- ts(x, start=x[1]) x.length <- seq(length = length(x)) x.lag <- l...
  • 0 votes
     answers
     views

    依靠符合标准的每个组R [重复]

    这个问题在这里已有答案: Easy way to convert long to wide format with counts [duplicate] 4个答案 我有以下数据集,我试图找到每台机器处于活动状态并基于SwitchedOnDate处于睡眠模式的天数 . MachineID InstalledDate SwitchedOnDate Status 1 2010-...
  • 0 votes
     answers
     views

    使用PLYR来计算哪种条件

    我试图将which函数与count函数结合使用 . 我想计算一下这个条件的因素数量 . 此代码不正确,但任何建议将不胜感激 . library(plyr) count(data, 'factor', which numeric > 10) #Base version attempt count(data$factor, which(data$numeric > 10)) Error...
  • 2 votes
     answers
     views

    在每一行上运行函数,返回多行R.

    经过大量的实验和谷歌搜索...以及随后的实验再次,我终于得到了关于StackOverflow的第一个问题:) 我有一个data.frame,并希望将自定义函数 expandBases 应用于data.frame的每一行 . expandBases 返回由1行或更多行组成的data.frame(这将根据提供给它的数据而有所不同) . expandBases 实际上返回的列数多于下面的玩具示例...
  • 0 votes
     answers
     views

    情节列w.r.t.矩阵中的行

    我有一个矩阵 mat 如下: V1 V2 Helsinki Bus Helsinki Bus Helsinki Tram London Train London Bus London Train ... 我想要的是制表(使用R),如下所示: V1 V2 V3 Helsinki Bus 2 Helsinki ...
  • 1 votes
     answers
     views

    使用ggplot2的多个数据帧的geom_point和geom_errorbar

    我想使用ggplot2绘制两个每周平均时间序列(来自代表不同仪器的两个不同数据帧) . 这应该很简单,但我必须遗漏一些东西 . 我查看了以下帖子: using-both-geom-point-and-geom-line-for-multiple-x-in-ggplot2 object-not-found-error-with-ggplot2-when-adding-shape-aesthetic ...
  • 1 votes
     answers
     views

    使用ddply()聚合相对直方图计数

    与之前提出的问题(ggplot2 how to get 2 histograms with the y value = to count of one / sum of the count of both)相关,我尝试编写一个函数,该函数将data.frame作为输入,具有几个条件下几个参与者的响应时间(RT)和准确度(正确),并输出"summary"数据.frame,如直方图...
  • 14 votes
     answers
     views

    R ggplot和facet网格:如何控制x轴断点

    我试图使用ggplot绘制每个日历年的时间序列中的变化,并且我对x轴的精细控制存在问题 . 如果我不使用 scale="free_x" 那么我最终会得到一个显示几年以及相关年份的x轴,如下所示: 如果我确实使用了 scale="free_x" ,那么就像我们预期的那样,我最终会为每个情节添加刻度标签,并且在某些情况下会因情节而异,我不想要: 我已尝试使用...
  • 0 votes
     answers
     views

    如何将每日 Value 汇总限制为月度和年度总计?

    我有一个动物园对象(stn)的每日数据的长记录(日期Vs下雨) . 我用过hydoTSM包 (m < - daily2monthly(stn,FUN = sum,na.rm = TRUE)) 这工作正常,但我想只允许聚合几个月,至少20个每日记录 . 对于年度,应提供至少10个月的记录 . 任何人都可以建议一个更好的方法吗?
  • 1 votes
     answers
     views

    如何通过多个组获取多个变量的摘要统计信息?

    我知道在这个论坛中提供了许多答案,关于如何使用 aggregate , ddply 或 data.table 等选项获取多个组的摘要统计信息(例如,mean,se,N) . 但是,我不确定如何在多个列上同时应用这些函数 . 更具体地说,我想知道如何在多列(dv1,dv2,dv3)上扩展以下 ddply 命令,而无需每次都重新键入具有不同变量名的代码 . library(reshape2) libr...

热门问题