首页 文章
  • 14 votes
     answers
     views

    R ggplot和facet网格:如何控制x轴断点

    我试图使用ggplot绘制每个日历年的时间序列中的变化,并且我对x轴的精细控制存在问题 . 如果我不使用 scale="free_x" 那么我最终会得到一个显示几年以及相关年份的x轴,如下所示: 如果我确实使用了 scale="free_x" ,那么就像我们预期的那样,我最终会为每个情节添加刻度标签,并且在某些情况下会因情节而异,我不想要: 我已尝试使用...
  • 5 votes
     answers
     views

    使用dplyr从不同的data.frame中提取数据?

    我有一个名为dat_new的数据框,基本上是诊所访问数据,hrn是患者ID,而dov是访问日期(每人多次访问) . 然后我有一个名为事件的数据框,其中有过期的住院(每人多次入院) . 我想做的是,对于每次门诊就诊,我想总结在门诊就诊之前发生的住院,简单 . 这适用于plyr的ddply,需要一点时间但效果很好 . temp <- ddply(dat_new, .(hrn,dov), summ...
  • 81 votes
     answers
     views

    dplyr总结:相当于“ . drop = FALSE”以保持输出中长度为零的组

    使用 summarise 和 plyr 的 ddply 函数时,默认情况下会删除空类别 . 您可以通过添加 .drop = FALSE 来更改此行为 . 但是,当 summarise 与 dplyr 一起使用时,这不起作用 . 还有另一种方法可以在结果中保留空类别吗? 这是假数据的一个例子 . library(dplyr) df = data.frame(a=rep(1:3,4), b=rep(...
  • 1 votes
     answers
     views

    R多个分类变量的频率表

    我已经将SPSS .SAV文件中的访谈数据导入 data.frame ,现在我'm trying to create a frequency table based on the question number and interview location. Here'是一个例子 data.frame : loc<-c("city1","city2",...
  • 0 votes
     answers
     views

    如何将每日 Value 汇总限制为月度和年度总计?

    我有一个动物园对象(stn)的每日数据的长记录(日期Vs下雨) . 我用过hydoTSM包 (m < - daily2monthly(stn,FUN = sum,na.rm = TRUE)) 这工作正常,但我想只允许聚合几个月,至少20个每日记录 . 对于年度,应提供至少10个月的记录 . 任何人都可以建议一个更好的方法吗?
  • 0 votes
     answers
     views

    R:每小时到每日降水,包装plyr,ER:“没有数值”

    我有小时的降水值,我想在一小时内总结一下 . 我的数据(Nd_hourly)看起来像这样: Datum Uhrzeit Nd 1 2013-05-01 01:00:00 0.0 2 2013-05-01 02:00:00 0.1 3 2013-05-01 03:00:00 0.0 4 2013-05-01 04:00:00 0.3 (日期,时间...
  • 4 votes
     answers
     views

    R中的ddply:对于每个组,查找特定变量的出现百分比

    我有一个数据集,其中包含两列,user_type和滞后响应时间(以天为单位): user_type imp_date lag Consumer 20130613 1 Consumer 20130612 2 Consumer 20130611 3 Consumer 20130612 ...
  • 0 votes
     answers
     views

    在另一个函数中定义聚合函数时出现ddply错误

    以下几乎最小代码的要点是在函数f中应用ddply,其中ddply的聚合函数(helper)在f的定义中是自定义的 . 不幸的是,我不明白为什么采购整个代码段会产生eval中的错误(expr,envir,enclos):找不到函数"helper" . 当辅助函数独立于函数f运行时,代码有效 . 当我用 by 的未注释调用替换 ddply 调用时,代码运行没有错误 . 您能解释错误...
  • 7 votes
     answers
     views

    使用ddply分配组ID

    来自R新手的非常基本的表现问题 . 我想通过唯一的字段组合为数据框中的每一行分配一个组ID . 这是我目前的做法: > # An example data frame > df <- data.frame(name=c("Anne", "Bob", "Chris", "Dan", "Erin...
  • 2 votes
     answers
     views

    使用ddply选择组的最小值

    我的数据框看起来像这样 TFexp ID Entrez_Gene_ID Symbol adj.P.Val P.Value t B logFC GSM507414 ILMN_1765574 7020 TFAP2A 0.03071446 0.001797766 -5.9919321 -1.0120...
  • 1 votes
     answers
     views

    DDPLY分组错误

    我正在运行 ddply 函数并继续收到错误 . Structure of data.frame: str(visits.by.user) 'data.frame': 80317 obs. of 5 variables: $ ClientID : Factor w/ 147792 levels "50912733","50098716",..: ...
  • 24 votes
     answers
     views

    ddply表示R中的组合

    我有一个示例数据帧“数据”如下: X Y Month Year income 2281205 228120 3 2011 1000 2281212 228121 9 2010 1100 2281213 228121 12 2010 900 2281214 228121 3 2011 9000 2281222 22812...
  • 3 votes
     answers
     views

    ddply没有组的整个数据?

    是否可以使用ddply来汇总数据而不需要按组分层?我尝试过类似的东西 ddply(df, summarize, a = sum(a, na.rm=T), b = sum(b, na.rm=T))
  • 7 votes
     answers
     views

    按组分组多个分位数

    我该怎么做这个计算: library(ddply) quantile(baseball$ab) 0% 25% 50% 75% 100% 0 25 131 435 705 按群组说,"team"?我想要一个带有rownames "team"和列名"0% 25% 50% 75% 100%"的data.frame,即...
  • 13 votes
     answers
     views

    R版3.0.2的Rly plyr包不可用吗? [重复]

    这个问题在这里已有答案: How should I deal with “package 'xxx' is not available (for R version x.y.z)” warning? 16个答案 我尝试安装plyr软件包,并收到警告消息,说它不适用于R 3.0.2版 . 这是真的还是不是?如果没有,为什么我会收到这条消息?我尝试使用两个不同的CRAN镜像,两者都给出了相同的信息...
  • 7 votes
     answers
     views

    安装plyr / rcpp时出错

    我有两台计算机,其中一台我无法安装R的plyr包 . 这是我得到的错误: * installing *source* package ‘plyr’ ... ** package ‘plyr’ successfully unpacked and MD5 sums checked ** libs g++ -I/usr/share/R/include -DNDEBUG -I"/usr/li...
  • 0 votes
     answers
     views

    包'plyr'不可用(对于R版本3.0.2)

    当我在r3.0.2中安装plyr时 install.packages(“plyr”) 它发生了这样的错误:包'plyr'不可用(对于R版本3.0.2)
  • 1 votes
     answers
     views

    每天给定间隔的最大斜率

    我有一组时间序列数据,其中地面温度每隔10分钟从三个不同的位置测量多天(实际上是2年的数据) . 我感兴趣的是计算每个站点每天60分钟间隔的最大斜率(温度升高速率) . 所以基本上我想每天工作10分钟,每次60分钟,并计算每个窗口的坡度,然后确定最大坡度以及白天发生的时间 . 然后,我想将此函数应用于数据集中的每一天 . 日期/时间采用以下格式(%m /%d /%y%H:%M) . 我正在想象使用...
  • 1 votes
     answers
     views

    R:rollapplyr和lm因子错误:rollapplyr是否更改了变量类?

    这个问题 Build 在前一个问题的基础之上,这个问题对我很有帮助 . R: Grouped rolling window linear regression with rollapply and ddply 难道你不知道代码在扩展到真实数据而不是示例数据时不能正常工作吗? 我有一个有点大的数据集,具有以下特征 . str(T0_satData_reduced) 'data.frame': 4...
  • 1 votes
     answers
     views

    如何通过多个组获取多个变量的摘要统计信息?

    我知道在这个论坛中提供了许多答案,关于如何使用 aggregate , ddply 或 data.table 等选项获取多个组的摘要统计信息(例如,mean,se,N) . 但是,我不确定如何在多个列上同时应用这些函数 . 更具体地说,我想知道如何在多列(dv1,dv2,dv3)上扩展以下 ddply 命令,而无需每次都重新键入具有不同变量名的代码 . library(reshape2) libr...
  • 1 votes
     answers
     views

    具有ddply的面板中的滞后变量

    我试图在实质上是面板数据集中生成精度变化(基于估计的置信区间) . 因此,作为一个简单的例子,这里是我编写的函数并将其应用于非感性示例.... precision.gain <- function(x){ x <- ts(x, start=x[1]) x.length <- seq(length = length(x)) x.lag <- l...
  • 0 votes
     answers
     views

    如何将plyr包代码的ddply实现到以下cabbage_exp数据集的dplyr . 任何帮助都会得到满足

    ### This is a R related problem. ### I'm using windows 10 ### Latest R version and Packages library(plyr) library(dplyr) library(gcookbook) 在 gcookbook 库中有一个名为 cabbage_exp 的数据集 . 在这个数据集中,我想计算每个组内的...
  • 77 votes
     answers
     views

    如何使用dplyr选择每组中具有最大值的行?

    我想用dplyr在每个组中选择一个具有最大值的行 . 首先,我生成一些随机数据来显示我的问题 set.seed(1) df <- expand.grid(list(A = 1:5, B = 1:5, C = 1:5)) df$value <- runif(nrow(df)) 在plyr中,我可以使用自定义函数来选择此行 . library(plyr) ddply(df, .(A, B...
  • 1 votes
     answers
     views

    使用ggplot / plyr按条形段的总和重新排序条形图

    我需要在下面的堆积条形图中的11个条形图由每个条形的前两个区段的总和重新排序,即按图中的(红色绿色)区段排序 . > dput(q1m.bl) structure(list(ItemA = structure(c(1L, 2L, 3L, 4L, 1L, 2L, 3L, 4L, 1L, 2L, 3L, 4L, 2L, 3L, 4L, 1L, 2L, 3L, 4L, 1L, 2L, 3L, 4...
  • 4 votes
     answers
     views

    使用plyr / dplyr / purrr向数据框添加多个列的方法

    我经常需要使用自定义函数一次通过多个列来改变数据帧,最好使用并行化 . 以下是我已经知道如何做到这一点的方法 . Setup library(dplyr) library(plyr) library(purrr) library(doMC) registerDoMC(2) df <- data.frame(x = rnorm(10), y = rnorm(10), z = rnorm(10...
  • 0 votes
     answers
     views

    在使用ddply进行汇总时如何添加列

    我的问题是总结一个带有 ddply 函数的data.frame,例如:下面 . 该功能用于创建具有最大额定值的新数据框和相应的公司 . 缺少的是第一个数据框中的相应ID . 我试图调用ID变量,但这会导致错误消息 . 我对与最高评级相对应的ID感兴趣 . 非常感谢您的帮助! dat <- data.frame(ID = c("A11", "A12", ...
  • 0 votes
     answers
     views

    在ddply中进行汇总时获取which.max的行名

    我有以下数据,想要获得每年最高收盘价的最新日期 . > str(ndvdf) 'data.frame': 1374 obs. of 2 variables: $ Close: num 150 150 150 150 150 ... $ Year : num 2009 2009 2009 2009 2009 ... > head(ndvdf) Clo...
  • 5 votes
     answers
     views

    ddply函数求和中的错误?

    第一次在这里发帖!我在使用ddply函数时遇到问题 . 我有这个表,我想用“LC”列总结,并在“Area”列中添加值: ID LC per Area 1 1 7 0.29 62428.3 2 1 7 0.79 170063.3 3 1 4 0.40 86108.0 4 1 7 0.43 92566.1 5 1 6 1.00 215270.0 6 1 7 0....
  • 2 votes
     answers
     views

    将函数中的值传递给ddply

    我有 ddply 沿这些方向构建一个 data.frame : out <- ddply(data, .(names), varA = sum(value > 10)) 这很好,所以我试着把它放到一个函数中 func <- function(val.in) { out <- ddply(data, .(names), varA = sum(value > v...
  • 1 votes
     answers
     views

    R:关于如何为data.frame中的每一行计算其他条件的新列的建议

    对于行中的每个条目,我需要计算两个变量作为data.frame中的新列,这取决于超过60个其他列 . 我希望你的建议如何实现优雅(同时,for,for,with,ifelse,foreach,by或ddply?) . 我不喜欢手动这样做,就像我在示例代码中的第一个案例那样,我不关心性能 . 进一步:可能我不需要问我是否理解如何使用变换(使用ddply或by)等功能以及它们的功能 . 因此,我希望你...

热门问题