首页 文章
  • 1 votes
     answers
     views

    将时间序列结果转换为日期

    我使用 fpp2 进行预测 . 我的工作流程涉及导入数据,转换为时间序列,然后进行预测 . 一个痛点是,在预测之后,我留下的数据是我当前数据的扩展,但不再保留相同的 date 列 . 例如,如果我使用几周,那么我的日期看起来如下所示: >wks date wk y 2016-01-04 1 2500 2016-01-11 2 2530 2016-01-18 ...
  • 1 votes
     answers
     views

    没有过滤器或left_join的分组数据的条件计数和均值

    如何在没有使用dplyr的过滤器的情况下通过分组数据计算条件计数和均值?我既不想使用过滤器缩小数据集,也不想使用left_join数据来获取原始大小(加长)的数据集 . 那可能吗? 这是一个案例: mtcars%>%filter(cyl> 4,gear <5)%>%group_by(gear,carb,am)%>%mutate(avg_mpg = mean(mpg,n...
  • 0 votes
     answers
     views

    以编程方式选择要放入dplyr管道的变量

    我正在处理数据集(来自智能手机体验抽样),我必须经常进行分组操作(例如在每个人中找到度量的可变性,或者在每个人的每一天内等等) . 典型的代码可能看起来像下面的代码,它计算一些变量的日内变化,然后采用日内变化的平均值并将其与原始数据相连 . output <- group_by(mydata, id, day) %>% mutate_at(vars(angr, sad, guil,...
  • 1 votes
     answers
     views

    使用`dplyr :: mutate()`从向量中指定的名称创建几个新变量

    我想在数据框中创建几个新的空变量,我在向量中指定变量名称 . 如果我只指定一个变量名称,但会断开多个变量名称,则此方法有效我尝试了一些以前的解决方案,但它们在这种情况下似乎不起作用,例如: dplyr without hard-coding the variable names Pass a vector with names to mutate to create multiple ne...
  • 4 votes
     answers
     views

    如何避免使用预训练/外部模型在R中使用keras进行图像分类

    我有以下代码 . 数据集可以下载here或here . 数据集包含分类为 cat 或 dog 的图像 . 此代码的任务是用于训练猫狗图像数据 . 因此,给定一张图片,它可以判断它是狗还是狗 . 它的动机是page . 以下是完全运行的代码: library(keras) # Organize dataset -------------------------------------------...
  • 1 votes
     answers
     views

    对于带有sigma.formula术语的gamlss模型,无法使用扫帚获得置信区间

    我正在调用一个gamlss模型: model <- gamlss(formula = formula("y_variable ~ image_name + random(biological_source_name) - 1"), sigma.formula = formula("~ biological_source_name - 1"...
  • 5 votes
     answers
     views

    对多个dplyr过滤条件使用整齐的eval

    我是整理eval并尝试编写泛型函数的新手 - 我现在正在努力的一件事就是为分类变量编写多个过滤条件 . 这就是我现在正在使用的 - create_expr <- function(name, val){ if(!is.null(val)) val <- paste0("c('", paste0(val, collapse = "','&qu...
  • 1 votes
     answers
     views

    使用dplyr / plyr计算行间的百分比?

    我有一个数据帧x,像这样 . set.seed(1) x <- data.frame(id = letters[1:3], c1 =runif(3,max=3), c2 = runif(3,max=2), c3 = runif(3,max=4)) # id c1 c2 c3 # 1 a 0.3271498 1.8415800 0.3496333 ...
  • 1 votes
     answers
     views

    使用dplyr的困难时间 - n_distinct或spread - 使用子组

    我想这个问题是重复的,但我找不到任何有效的答案,以简单而优雅的方式使用dplyr在group_by之后添加子组计数 . 如果此问题重复,请删除 . 如果你想要一个代码重现,我会这样做 . 请不要点击“否定” . 我曾尝试使用 spread ,但它没有用,之后,我试图按照说明here,一旦它有助于在数据框中按组计数唯一,但它不起作用 . 同样的解决方案是here,但输出很奇怪 . 我有什么: 我真正...
  • 3 votes
     answers
     views

    使用tidyverse根据来自另一个数据帧的分组值范围从数据框中提取分组值

    我试图从数据帧(df1)中提取分组索引值,该数据帧表示分组时间范围(开始 - 结束),并且包含在另一个数据帧(df2)中给出的分组时间 . 我需要的输出是df3 . df1<-data.frame(group = c("A","A","A","A","B","B",&quo...
  • 3 votes
     answers
     views

    使用字符串查找唯一行,并汇总dataframe列的相应值

    我有一个数据帧: gene=c("Esr", "Esr", "Esr", "Nop", "Nop", "Nop", "Stu", "Mkp", "Mkp", "P53", "Ard&quot...
  • 3 votes
     answers
     views

    相关矩阵与dplyr,tidyverse和扫帚 - P值矩阵

    所有 . 我想使用 dplyr and/or broom packages and testing multiple variables at the same time 从相关矩阵中获取p值 . 我知道其他方法,但dplyr对我来说似乎更容易,更直观 . 此外,dplyr需要关联每个变量以获得特定的p值,这使得过程更容易和更快 . 我检查了其他链接,但它们不适用于这个问题(example 1...
  • 0 votes
     answers
     views

    如何让ggplot从特定月份开始x轴

    我想在11月开始的一个赛季中绘制一个按月份在足球比赛中得分的进球图,但是会延续到明年 . 所以我想让x轴去11月,12月,1月等 . 这是我必须使用的一些玩具数据 library(tidyverse) library(lubridate) df <- data.frame(date = as.Date(c("2017-11-01","2017-11-15&quo...
  • 1 votes
     answers
     views

    R:在dplyr中使用自定义功能

    样本数据: library(tidyverse) set.seed(123) dat <- tibble( year = rep(1980:2015, each = 100), day = rep(200:299, times = 36), rain = sample(0:17, size = 100*36,repla...
  • 1 votes
     answers
     views

    使用dplyr更好的输出 - 破坏功能和结果

    这是一个持久的问题,但现在我真的要解决这个难题 . 我一直在使用dplyr,我觉得它很棒 summarise variables . 但是,我正在尝试仅显示部分成功的数据透视表 . Dplyr总是报告 one single row with all results ,什么令人讨厌 . 我必须将结果复制粘贴到excel以组织所有内容...... 我得到了代码here,它几乎正常工作 . 这个结果...
  • 2 votes
     answers
     views

    tidyverse:汇总时计算特定级别的数量

    在分组后总结时,我想计算另一个因素的特定级别的数量 . 在下面的工作示例中,我想计算每组中 "male" 级别的数量 . 我已经尝试了许多计数,计数等等但却无法找到一种简单明了的方法来做到这一点 . df <- data.frame(Group=replicate(20, sample(c("A","B"), 1)), ...
  • 2 votes
     answers
     views

    以编程方式分解数据框中的选定列,整齐的方式?

    这是一个简化的例子: library(tidyverse) frame <- tribble( ~a, ~b, ~c, 1, 1, 2, 5, 4, 7, 2, 3, 4, 3, 1, 6 ) key <- tribble( ~col, ~name, ~type, ~labels, 1, "a", ...
  • 1 votes
     answers
     views

    用于可视化或过滤P值的Tidy chisq.test输出的功能

    对于数据...... library(productplots) library(ggmosaic) 代码...... library(tidyverse) library(broom) 我正在尝试创建整洁的chisq.test输出,以便我可以轻松过滤或可视化p值 . 我正在使用“快乐”数据集(包含在上面列出的任何一个包中) 对于这个例子,如果我想在所有其他变量上调整“happy”变量,我...
  • 1 votes
     answers
     views

    tidyverse:根据其他行中的值从数据框中删除行

    我有一小部分调查数据 . 每一行代表一次对“受访者”的访谈 . 一些受访者接受过一次访谈;其他人多次接受采访 . 我想从这个小组中选择每个受访者的最后一次面试 . 这是一个最小的例子: tmp <- tribble( ~YYYYMM, ~ID, ~DATEPR, ~IDPREV, 198001, 1, NA, NA, 198001, 2, ...
  • 4 votes
     answers
     views

    使用带有否定选择助手的mutate_at(),例如(不是one_of())

    我的数据看起来像这样: library(dplyr) set.seed(123) df <- data_frame(X1 = rep(LETTERS[1:4], 6), X2 = rep(1:2, 12), ref = sample(1:50, 24), sampl1 = samp...
  • 3 votes
     answers
     views

    使用group_by时mutate_at评估错误

    mutate_at()显示与group_by()一起使用时以及将列位置的数字向量作为第一个(.vars)参数进行插入时的评估错误 . 使用 R 3.4.2和 dplyr 0.7.4版本时出现问题 使用 R 3.3.2和 dplyr 0.5.0时工作正常 如果.vars是字符向量(列名),则工作正常 例: # Create example dataframe Id <-...
  • 1 votes
     answers
     views

    使用mutate_at和which.max对数据帧的选定列进行操作

    我正在尝试使用 mutate_at 和 which.max 的组合来操纵数据框,如下所述 . #This is basically what I want to achieve df_want <- iris %>% group_by(Species) %>% mutate(Sepal.Length = Sepal.Length[which.max(Petal.Width)], ...
  • 1 votes
     answers
     views

    在Tidyverse中使用“mutate_at”在多个变量中重新编码相同的因子水平值

    我有几个因子变量,值"1"和"2"需要重新编码为"Yes"和"No" . 使用fct_recode的Tidyverse mutate_at似乎是正确的工具 . 然而, dataframe %>% mutate_at(vars (var1, var9, var17) = fct_rec...
  • 0 votes
     answers
     views

    R - 合并2个数据帧,其间有时间戳

    DF1: structure(list(X = c(113.8577674, 113.8577537, 113.8577403), Y = c(22.19537297, 22.19537222, 22.1953723), Date = c("7/1/2016", "7/1/2016", "7/1/2016"), Tim...
  • 1 votes
     answers
     views

    从一个数据框的多个列中查找不在另一个数据框的多列中的元素

    library(tidyverse) 我有两个数据帧(参见底部的示例代码),名为Df1和Df2 . 我想在Df1(来自所有列)中找到不在Df2的任何电话号码列中的电话号码 . 首先,我重构Df1,以便每行只有一个Id . Df1<-Df1 %>% gather(key, value, -Id) %>% filter(!is.na(value)) %>% select(...
  • 0 votes
     answers
     views

    R:使用tidyverse的中值浓度的时间序列图

    我是R的新手,我正在尝试为我的数据集中给定变量的中位数浓度创建一个时间序列图 . 但是我没有得到我想要的东西,我不明白我是什么我做错了 . 一旦我创建了新的数据帧(data_median),一些数据就会出现N / A.这使图表不完整..我将非常感谢任何帮助!提前致谢! 预览我的代码: if (!require(pacman)) { install.packages('pacman') } ...
  • 6 votes
     answers
     views

    dplyr:如何以编程方式将full_join数据帧包含在列表列表中?

    上下文和数据结构 我将与您分享我的庞大数据集的简化版本 . 此简化版本完全尊重原始数据集的结构,但包含的列表元素,数据框架,变量和观察结果比原始数据集少 . 根据对该问题的最热烈回答:How to make a great R reproducible example ?,我使用 dput(query1) 的输出共享我的数据集,通过在R控制台中复制/粘贴以下代码块,为您提供可立即在R中使用的内容:...
  • 0 votes
     answers
     views

    dplyr group由多个变量按多个变量汇总

    R的新手 . 使用dplyr,尝试group_by多个变量,由多个变量,多个函数汇总 . 这按预期工作 mtcars %>% + group_by(cyl,hp) %>% + summarise(min_mpg = min(mpg) , min_disp = min(disp), max_mpg = max(mpg) , max_disp = max(disp)) ...
  • 3 votes
     answers
     views

    如果每个观察可以属于多个组,则进行聚合

    我想按组聚合日期 . 然而,每个观察可以属于几个组(例如,观察1属于组A和B) . 我找不到用 data.table 实现这个目标的好方法 . 目前,我为每个可能的组创建了一个逻辑变量,如果观察属于该组,则该变量的值为 TRUE . 我正在寻找一种比下面提供的更好的方法 . 我也想知道如何用 tidyverse 实现这一目标 . library(data.table) # Data set.se...
  • 2 votes
     answers
     views

    使用tidyverse转换一组反向列的类?

    如何使用tidyverse转换一组反向列的类? 在这里,数据框 sumtbl 具有临床试验患者Bill和Ted的实验室测试结果,并且反向列的类别是因子 . 我使用tidyr spread 函数将实验室结果从长到宽转换 . 我在这个例子中使用as.character,因为在现实世界中,我的结果是存储为字符值的数字 . set.seed(7073) basetbl <- data.frame(...

热门问题