首页 文章
  • 6 votes
     answers
     views

    dplyr:如何以编程方式将full_join数据帧包含在列表列表中?

    上下文和数据结构 我将与您分享我的庞大数据集的简化版本 . 此简化版本完全尊重原始数据集的结构,但包含的列表元素,数据框架,变量和观察结果比原始数据集少 . 根据对该问题的最热烈回答:How to make a great R reproducible example ?,我使用 dput(query1) 的输出共享我的数据集,通过在R控制台中复制/粘贴以下代码块,为您提供可立即在R中使用的内容:...
  • 2 votes
     answers
     views

    使用带有命名向量的汇总

    我正在尝试使用汇总,其中汇总的向量具有名称 . 汇总函数将这些名称复制到输出,但现在长度错误 . 当我尝试格式化生成的摘要时,names属性的不正确长度会引发错误 . 在我真正关心的例子中,带有名称的向量是来自glm模型的拟合值 . 我不想要这些名字,但它们是免费的 . 下面的玩具示例使用mtcars . ``` r library(tidyverse) #> -- Attaching p...
  • 2 votes
     answers
     views

    使用tidyverse转换一组反向列的类?

    如何使用tidyverse转换一组反向列的类? 在这里,数据框 sumtbl 具有临床试验患者Bill和Ted的实验室测试结果,并且反向列的类别是因子 . 我使用tidyr spread 函数将实验室结果从长到宽转换 . 我在这个例子中使用as.character,因为在现实世界中,我的结果是存储为字符值的数字 . set.seed(7073) basetbl <- data.frame(...
  • 1 votes
     answers
     views

    过滤由nrow进行的过滤

    我是那样的傻瓜 >dat # A tibble: 556 × 3 sample run abc <chr> <chr> <list> 1 206_03_07_2013 21102016 <tibble [304 × 2...
  • 1 votes
     answers
     views

    基于另一个tibble从tibble列中减去值

    说我有一些 Value 观: raw = tibble( group = c("A", "B", "C", "A", "B", "C"), value = c(10, 20, 30, 40, 50, 60) ) # A tibble: 6 x 2 group...
  • 1 votes
     answers
     views

    在不同级别的应用中应用功能

    我有以下几点: library(tidyverse) set.seed(1234) df <- tibble( x1 = letters[1:2], y1 = list( tibble( x2 = letters[3:4], y2 = list( tibble( x3 = seq(1, 100, 1), ...
  • 1 votes
     answers
     views

    将时间序列结果转换为日期

    我使用 fpp2 进行预测 . 我的工作流程涉及导入数据,转换为时间序列,然后进行预测 . 一个痛点是,在预测之后,我留下的数据是我当前数据的扩展,但不再保留相同的 date 列 . 例如,如果我使用几周,那么我的日期看起来如下所示: >wks date wk y 2016-01-04 1 2500 2016-01-11 2 2530 2016-01-18 ...
  • 1 votes
     answers
     views

    没有过滤器或left_join的分组数据的条件计数和均值

    如何在没有使用dplyr的过滤器的情况下通过分组数据计算条件计数和均值?我既不想使用过滤器缩小数据集,也不想使用left_join数据来获取原始大小(加长)的数据集 . 那可能吗? 这是一个案例: mtcars%>%filter(cyl> 4,gear <5)%>%group_by(gear,carb,am)%>%mutate(avg_mpg = mean(mpg,n...
  • 0 votes
     answers
     views

    以编程方式选择要放入dplyr管道的变量

    我正在处理数据集(来自智能手机体验抽样),我必须经常进行分组操作(例如在每个人中找到度量的可变性,或者在每个人的每一天内等等) . 典型的代码可能看起来像下面的代码,它计算一些变量的日内变化,然后采用日内变化的平均值并将其与原始数据相连 . output <- group_by(mydata, id, day) %>% mutate_at(vars(angr, sad, guil,...
  • 1 votes
     answers
     views

    使用`dplyr :: mutate()`从向量中指定的名称创建几个新变量

    我想在数据框中创建几个新的空变量,我在向量中指定变量名称 . 如果我只指定一个变量名称,但会断开多个变量名称,则此方法有效我尝试了一些以前的解决方案,但它们在这种情况下似乎不起作用,例如: dplyr without hard-coding the variable names Pass a vector with names to mutate to create multiple ne...
  • 1 votes
     answers
     views

    dplyr tidyr扩大和总结特定列

    我正在努力使用dplyr和tidyr来获取这种形式的df: myDf <- data.frame(id = c(1,1,1,1,2,2), event = c('a','b','a','b','a','b'), a_property = c(1,NA,2, NA, 3, NA), ...
  • 0 votes
     answers
     views

    如何让ggplot从特定月份开始x轴

    我想在11月开始的一个赛季中绘制一个按月份在足球比赛中得分的进球图,但是会延续到明年 . 所以我想让x轴去11月,12月,1月等 . 这是我必须使用的一些玩具数据 library(tidyverse) library(lubridate) df <- data.frame(date = as.Date(c("2017-11-01","2017-11-15&quo...
  • 0 votes
     answers
     views

    dplyr group由多个变量按多个变量汇总

    R的新手 . 使用dplyr,尝试group_by多个变量,由多个变量,多个函数汇总 . 这按预期工作 mtcars %>% + group_by(cyl,hp) %>% + summarise(min_mpg = min(mpg) , min_disp = min(disp), max_mpg = max(mpg) , max_disp = max(disp)) ...
  • 3 votes
     answers
     views

    如果每个观察可以属于多个组,则进行聚合

    我想按组聚合日期 . 然而,每个观察可以属于几个组(例如,观察1属于组A和B) . 我找不到用 data.table 实现这个目标的好方法 . 目前,我为每个可能的组创建了一个逻辑变量,如果观察属于该组,则该变量的值为 TRUE . 我正在寻找一种比下面提供的更好的方法 . 我也想知道如何用 tidyverse 实现这一目标 . library(data.table) # Data set.se...
  • 3 votes
     answers
     views

    在geom中指定数据时,在 Map 上组合图例

    我正在使用 ggplot2 绘制 Map 并指向其上方 . 这包括绘制 Map 然后使用 geom_point() 来放置点 . 此外,这些点的大小根据另一个变量而变化 . 当我绘制它时会产生多个图例 . ggplot(mapdata, aes(x=long, y=lat)) + geom_map(map=mapdata, aes(map_id=region), fill="#fff...
  • 2 votes
     answers
     views

    你如何在mutate_at()中使用approx()?

    我在让mut()在mutate_at()中工作时遇到问题 . 我确实设法使用一个很长的mutate()函数来获得我想要的东西,但为了将来的参考,我想知道是否有更优雅且更少复制粘贴的mutate_at()方法来做到这一点 . 最重要的问题是将数据集与1年间隔的数据合并为3年间隔的数据,并插入数据集中没有数据的年份,间隔为3年 . 这些年中缺少值,而一年需要某种形式的推断 . library(&quo...
  • 0 votes
     answers
     views

    在r中使用reprex包创建可重现的示例,其中正在读取本地文件

    我经常使用 reprex::reprex 创建可重复的 R 代码示例,以获取其他人的帮助以消除代码中的错误 . 通常,我使用 iris 或 mtcars 等数据集创建最少的示例,并且效果很好 . 但是,每当我需要使用 own 数据时,我总是无法使用 reprex ,因为问题是如此具体,我不能依赖来自 datasets 库的数据集 . 在这种情况下,我收到以下错误: # loading needed...
  • 1 votes
     answers
     views

    dplyr中的变量名冲突

    我试图使用dplyr计算data.frame中包含的变量的移动中位数 . 我遇到的问题是我传递给rollapply()的函数与原始data.frame中的变量同名 . 例如: df <- data.frame(median = seq(1:100)) df %>% mutate(ln_median = log(median)) %>% mutate(ln_median_...
  • 2 votes
     answers
     views

    创建一个新列,它是dplyr中特定列(由其名称选择)的总和

    我的问题是如何创建一个新列,它是dplyr中某些特定列(由其名称选择)的总和 . 例如,使用iris数据集,我创建一个名为Petal的新列,它是Petal.Length和Petal.Width的总和 . iris %>% mutate(Petal = Petal.Length+Petal.Width) 现在假设我有一个20列的数据集,其名称中包含'Petal' . 我想创建一个“Petal...
  • 2 votes
     answers
     views

    purrr映射不产生整洁的数据

    感谢这个网站,我正在使用R purrr 包来聚合基于多列的数据 . 聚合是我想要的,但输出不是 . 以下是使用 mtcars 数据集的示例 . library(dplyr) library(purrr) #pull in data data <- mtcars #get colnames variable1 <- colnames(data) #map the variables t...
  • 2 votes
     answers
     views

    使用purrr映射到2个函数

    我有以下表格的数据 date data <chr> <list> 1 2012-01-05 <tibble [796 x 5]> 2 2012-01-12 <tibble [831 x 5]&...
  • 3 votes
     answers
     views

    如何在dplyr中用不等列(反向toString)分隔

    我正在使用调查数据尝试在一个列中进行多个响应 . 问题是可能有1-5个答案,用逗号分隔 . 我怎么转这个: df <- data.frame( splitThis = c("A,B,C","B,C","A,C","A","B","C") ) > df spl...
  • 2 votes
     answers
     views

    R:用dplyr对行顺序求和

    根据here和here这些类似问题的精神,我希望能够在 data_frame 中对一系列列进行求和并创建一个新列: df_abc = data_frame( FJDFjdfF = seq(1:100), FfdfFxfj = seq(1:100), orfOiRFj = seq(1:100), xDGHdj = seq(1:100), jfdIDFF = seq(1:100),...
  • 3 votes
     answers
     views

    dplyr使用变量列进行变异

    我正在尝试使用 mutate 创建一个包含基于特定列的值的新列 . 示例最终数据框(我正在尝试创建 new_col ): x = tibble(colA = c(11, 12, 13), colB = c(91, 92, 93), col_to_use = c("colA", "colA", "colB&...
  • 1 votes
     answers
     views

    对于带有sigma.formula术语的gamlss模型,无法使用扫帚获得置信区间

    我正在调用一个gamlss模型: model <- gamlss(formula = formula("y_variable ~ image_name + random(biological_source_name) - 1"), sigma.formula = formula("~ biological_source_name - 1"...
  • 0 votes
     answers
     views

    R - 合并2个数据帧,其间有时间戳

    DF1: structure(list(X = c(113.8577674, 113.8577537, 113.8577403), Y = c(22.19537297, 22.19537222, 22.1953723), Date = c("7/1/2016", "7/1/2016", "7/1/2016"), Tim...
  • 2 votes
     answers
     views

    不推荐在tibble上设置行名 . 错误:'row.names'长度无效

    我正在尝试制作网站与物种丰度矩阵的热图 . 感谢Maurits Evers的一些代码,我仍然无法在没有错误消息的情况下运行它: 不建议在tibble上设置行名 . row.names中的错误< - .data.frame(* tmp *,value = list(Site = c(“AwarukuLower”,:invalid'row.names'length) 有人认为tidyver...
  • 4 votes
     answers
     views

    如何为data.frame的每一行调用一个函数?

    我有一个功能有几个参数 . 此函数返回data.frame . 我有另一个data.frame . 现在我想为data.frame的每一行调用我的函数(作为参数) . 结果data.frames我想rbind . 所以我想到了类似的东西 do.call(rbind, apply(df, 1, f)) 是我的朋友 . But: 在此调用期间,df将转换为矩阵 . 在此过程中,所有数字都将转换为字符...
  • 4 votes
     answers
     views

    如何避免使用预训练/外部模型在R中使用keras进行图像分类

    我有以下代码 . 数据集可以下载here或here . 数据集包含分类为 cat 或 dog 的图像 . 此代码的任务是用于训练猫狗图像数据 . 因此,给定一张图片,它可以判断它是狗还是狗 . 它的动机是page . 以下是完全运行的代码: library(keras) # Organize dataset -------------------------------------------...
  • 1 votes
     answers
     views

    使用map和purrr在listcolumn中指定NA

    library(tidyverse) k<-data_frame(u=c("A","B"),l=c(list(c(1,5,4)),list(c(7,5,1)))) 我想将listcolumn l中所有低于2的值设置为NA . 我如何使用 Map 在purrr世界中做到这一点? map(k$l,~.x[.x<2]<-NA) 抛出错...

热门问题