首页 文章
  • 1 votes
     answers
     views

    将函数应用于组的组(在ddply中应用)

    我的数据集如下所示: d = data.frame(year=rep(2000:2002,each=40),month=rep(c(rep(1:12,3),5,6,7,8),3),species=rep(c(rep(letters[1:12],3),"a","b","g","l"),3),species_group=N...
  • 0 votes
     answers
     views

    为什么tapply中的参数FUN与colwise结合无效

    我通常使用 colwise 和 tapply 的组合来计算数据框中的分组值 . 但是,我意外地发现 tapply 中的参数 FUN 无法与 plyr 中的 colwise 一起正常工作 . 示例如下: 数据: df <- data.frame(a = 1:10, b = rep(1:2, each = 5), c = 2:11) 正常: library(plyr) colwise(tappl...
  • 0 votes
     answers
     views

    结合tapply创建一个矩阵

    我需要使用来自 data.frame 的Ht数据创建一个包含列(Swing,Blues,Contra)和Rows(M,F)的矩阵 . 我需要创建一个NA值矩阵,然后使用每个tapply函数的结果逐行填充矩阵 . 它需要看起来像这样: Swing Blues Contra M 174.6 186.8 194.5 F 177.7 178 180.4 我有2个...
  • 5 votes
     answers
     views

    R使用null函数

    当 FUN 参数为 null 时,我无法理解 tapply 函数的作用 . documentation说: 如果FUN为NULL,则tapply返回一个向量,该向量可用于下标tapply正常生成的多路数组 . 例如,下面的文档示例是做什么的? ind <- list(c(1, 2, 2), c("A", "A", "B")) t...
  • -3 votes
     answers
     views

    在tapply中使用tapply

    我有一个很大的基因组数据 data.frame . 数据看起来像这样 - colnames(df)=c("id","chr","start","end","log2") 其中id是样本名称,chr是染色体的编号,start和end给我染色体上的位置,log2是该位置读取的高/低 . 因为有很多...
  • 2 votes
     answers
     views

    数据帧子集内的计算[R]

    面对子集计算的困难 . 我可以使用 ave , tapply , ddply 获得客户(因子)平均购买的整体统计数据,但我无法为每位客户计算 visit by visit 统计数据 . 下面的一些简化数据说明了我的数据和理想的结果 . 当前数据帧:(请注意,访问#1是最近的访问) customer visit date purchase_amt sarah ...
  • 0 votes
     answers
     views

    'Min'对于遭遇历史数据R Studio中的因素没有意义

    我有一个相当简单的动物遭遇历史数据集 Encounter history data - Shows each date data was collected and every animal that was seen during each encounter 我正在尝试运行一个函数,它将使用tapply代码提取每个动物的最早日期; disco1<-tapply(dataSc$Date,d...
  • 1 votes
     answers
     views

    像问题一样,但需要数据帧输出 - R.

    这是我的第一篇文章,希望我能解释一下我需要做些什么 . 我对R来说还是很新,我可能已经阅读了回答这个问题的帖子,但我不能为我的生活理解他们的意思 . 如果已经回答,请提前道歉 . 我有一个非常大的GPS位置数据集来自radiocollars,并且每天的位置数量不一致 . 我想浏览数据集,并根据GPS信号的准确度选择每天的单个数据点 . 所以它基本上看起来像这样 . Accuracy Mont...
  • 0 votes
     answers
     views

    在两列而不是一列上使用tapply

    我想计算几个图的基尼系数,其中R未使用包reldist中的gini()函数 . 我有一个数据框,我需要使用两列作为gini函数的输入 . > head(merged[,c(1,17,29)]) idp c13 w 1 19 126 14.14 2 19 146 14.14 3 19 76 39.29 4 19 74 39.29 5 19 86 39.29 6 ...
  • 13 votes
     answers
     views

    使用tapply按组分组多个列

    我想按组分别列出各个列,我的第一个想法是使用 tapply . 但是,我不能让 tapply 工作 . 可以 tapply 用于对多列进行求和吗?如果没有,为什么不呢? 我已经广泛搜索了互联网,发现很多类似的问题早在2008年就已发布 . 但是,这些问题都没有直接得到解答 . 相反,响应总是建议使用不同的功能 . 下面是一个示例数据集,我希望按州分配苹果,按州和国家分析李子 . 在下面,我编写了...
  • 1 votes
     answers
     views

    tapply - 创建NA?

    我正在尝试计算每人独特水果的平均数量(我的惯常做法数据) . 这适用于以下两行代码: with(df, tapply(fruit, names, FUN = function(x) length(unique(x))))->uniques sum(uniques)/length(unique(df$names)) aggregate(df[,"fruit"], by=l...
  • 2 votes
     answers
     views

    如何调用函数使用* apply with different data,其中output是list,intput是2x2矩阵的列表?

    我有10次运行模拟的数据,存储为列表 . 我想用这个数据调用函数 FUN1 ,而不重复代码10次 . FUN1 的输出是模型参数的值,这样: $theta=5 $Theta= 0.5 $pi_1 = 0.6 $pi_2 = 0.4 $loglik_1 = 123.6 ...
  • 2 votes
     answers
     views

    如何使用aggregate()来计算NA值并使用tapply()作为替代

    我是R的新手并且正在为R考试做准备,这将在一周内完成 . 在其中一个家庭作业问题上,我试图尽可能多地解决一个问题(准备更多的工具总是在时间限制的编码考试中派上用场) . 问题如下:在我的数据集中,“ ckm_nodes.csv ” 变量采用日期记录了医生开始处方四环素的月份,从1953年11月开始计算 . 如果医生没有在第17个月开始处方,即1955年2月,当研究结束时,这被记录为Inf . 如果...

热门问题