Java 学习之路

6 votes

answers

views

dplyr：如何以编程方式将full_join数据帧包含在列表列表中？

上下文和数据结构我将与您分享我的庞大数据集的简化版本 . 此简化版本完全尊重原始数据集的结构，但包含的列表元素，数据框架，变量和观察结果比原始数据集少 . 根据对该问题的最热烈回答：How to make a great R reproducible example ?，我使用 dput(query1) 的输出共享我的数据集，通过在R控制台中复制/粘贴以下代码块，为您提供可立即在R中使用的内容：...

r dplyr data-manipulation tidyverse
2 votes

answers

views

使用带有命名向量的汇总

我正在尝试使用汇总，其中汇总的向量具有名称 . 汇总函数将这些名称复制到输出，但现在长度错误 . 当我尝试格式化生成的摘要时，names属性的不正确长度会引发错误 . 在我真正关心的例子中，带有名称的向量是来自glm模型的拟合值 . 我不想要这些名字，但它们是免费的 . 下面的玩具示例使用mtcars . ``` r library(tidyverse) #> -- Attaching p...

r tidyverse summarize
2 votes

answers

views

使用tidyverse转换一组反向列的类？

如何使用tidyverse转换一组反向列的类？在这里，数据框 sumtbl 具有临床试验患者Bill和Ted的实验室测试结果，并且反向列的类别是因子 . 我使用tidyr spread 函数将实验室结果从长到宽转换 . 我在这个例子中使用as.character，因为在现实世界中，我的结果是存储为字符值的数字 . set.seed(7073) basetbl <- data.frame(...

r tidyverse
1 votes

answers

views

过滤由nrow进行的过滤

我是那样的傻瓜 >dat # A tibble: 556 × 3 sample run abc <chr> <chr> <list> 1 206_03_07_2013 21102016 <tibble [304 × 2...

r dplyr tidyverse tibble
1 votes

answers

views

基于另一个tibble从tibble列中减去值

说我有一些 Value 观： raw = tibble( group = c("A", "B", "C", "A", "B", "C"), value = c(10, 20, 30, 40, 50, 60) ) # A tibble: 6 x 2 group...

r dplyr tidyverse tibble
1 votes

answers

views

在不同级别的应用中应用功能

我有以下几点： library(tidyverse) set.seed(1234) df <- tibble( x1 = letters[1:2], y1 = list( tibble( x2 = letters[3:4], y2 = list( tibble( x3 = seq(1, 100, 1), ...

r tidyverse purrr tibble
1 votes

answers

views

将时间序列结果转换为日期

我使用 fpp2 进行预测 . 我的工作流程涉及导入数据，转换为时间序列，然后进行预测 . 一个痛点是，在预测之后，我留下的数据是我当前数据的扩展，但不再保留相同的 date 列 . 例如，如果我使用几周，那么我的日期看起来如下所示： >wks date wk y 2016-01-04 1 2500 2016-01-11 2 2530 2016-01-18 ...

r forecasting tidyverse
1 votes

answers

views

没有过滤器或left_join的分组数据的条件计数和均值

如何在没有使用dplyr的过滤器的情况下通过分组数据计算条件计数和均值？我既不想使用过滤器缩小数据集，也不想使用left_join数据来获取原始大小（加长）的数据集 . 那可能吗？这是一个案例： mtcars％>％filter（cyl> 4，gear <5）％>％group_by（gear，carb，am）％>％mutate（avg_mpg = mean（mpg，n...

r dplyr tidyverse
0 votes

answers

views

以编程方式选择要放入dplyr管道的变量

我正在处理数据集（来自智能手机体验抽样），我必须经常进行分组操作（例如在每个人中找到度量的可变性，或者在每个人的每一天内等等） . 典型的代码可能看起来像下面的代码，它计算一些变量的日内变化，然后采用日内变化的平均值并将其与原始数据相连 . output <- group_by(mydata, id, day) %>% mutate_at(vars(angr, sad, guil,...

r dplyr data-cleaning tidyverse
1 votes

answers

views

使用`dplyr :: mutate（）`从向量中指定的名称创建几个新变量

我想在数据框中创建几个新的空变量，我在向量中指定变量名称 . 如果我只指定一个变量名称，但会断开多个变量名称，则此方法有效我尝试了一些以前的解决方案，但它们在这种情况下似乎不起作用，例如： dplyr without hard-coding the variable names Pass a vector with names to mutate to create multiple ne...

r dplyr tidyverse tidyeval
1 votes

answers

views

dplyr tidyr扩大和总结特定列

我正在努力使用dplyr和tidyr来获取这种形式的df： myDf <- data.frame(id = c(1,1,1,1,2,2), event = c('a','b','a','b','a','b'), a_property = c(1,NA,2, NA, 3, NA), ...

r dplyr tidyr tidyverse
0 votes

answers

views

如何让ggplot从特定月份开始x轴

我想在11月开始的一个赛季中绘制一个按月份在足球比赛中得分的进球图，但是会延续到明年 . 所以我想让x轴去11月，12月，1月等 . 这是我必须使用的一些玩具数据 library(tidyverse) library(lubridate) df <- data.frame(date = as.Date(c("2017-11-01","2017-11-15&quo...

r ggplot2 tidyverse lubridate purrr
0 votes

answers

views

dplyr group由多个变量按多个变量汇总

R的新手 . 使用dplyr，尝试group_by多个变量，由多个变量，多个函数汇总 . 这按预期工作 mtcars %>% + group_by(cyl,hp) %>% + summarise(min_mpg = min(mpg) , min_disp = min(disp), max_mpg = max(mpg) , max_disp = max(disp)) ...

r dplyr rstudio tidyverse
3 votes

answers

views

如果每个观察可以属于多个组，则进行聚合

我想按组聚合日期 . 然而，每个观察可以属于几个组（例如，观察1属于组A和B） . 我找不到用 data.table 实现这个目标的好方法 . 目前，我为每个可能的组创建了一个逻辑变量，如果观察属于该组，则该变量的值为 TRUE . 我正在寻找一种比下面提供的更好的方法 . 我也想知道如何用 tidyverse 实现这一目标 . library(data.table) # Data set.se...

r dplyr data.table tidyverse
3 votes

answers

views

在geom中指定数据时，在 Map 上组合图例

我正在使用 ggplot2 绘制 Map 并指向其上方 . 这包括绘制 Map 然后使用 geom_point() 来放置点 . 此外，这些点的大小根据另一个变量而变化 . 当我绘制它时会产生多个图例 . ggplot(mapdata, aes(x=long, y=lat)) + geom_map(map=mapdata, aes(map_id=region), fill="#fff...

r ggplot2 maps tidyverse
2 votes

answers

views

你如何在mutate_at（）中使用approx（）？

我在让mut（）在mutate_at（）中工作时遇到问题 . 我确实设法使用一个很长的mutate（）函数来获得我想要的东西，但为了将来的参考，我想知道是否有更优雅且更少复制粘贴的mutate_at（）方法来做到这一点 . 最重要的问题是将数据集与1年间隔的数据合并为3年间隔的数据，并插入数据集中没有数据的年份，间隔为3年 . 这些年中缺少值，而一年需要某种形式的推断 . library(&quo...

r dplyr tidyverse
0 votes

answers

views

在r中使用reprex包创建可重现的示例，其中正在读取本地文件

我经常使用 reprex::reprex 创建可重复的 R 代码示例，以获取其他人的帮助以消除代码中的错误 . 通常，我使用 iris 或 mtcars 等数据集创建最少的示例，并且效果很好 . 但是，每当我需要使用 own 数据时，我总是无法使用 reprex ，因为问题是如此具体，我不能依赖来自 datasets 库的数据集 . 在这种情况下，我收到以下错误： # loading needed...

r tidyverse reproducible-research reprex
1 votes

answers

views

dplyr中的变量名冲突

我试图使用dplyr计算data.frame中包含的变量的移动中位数 . 我遇到的问题是我传递给rollapply（）的函数与原始data.frame中的变量同名 . 例如： df <- data.frame(median = seq(1:100)) df %>% mutate(ln_median = log(median)) %>% mutate(ln_median_...

r dplyr tidyverse
2 votes

answers

views

创建一个新列，它是dplyr中特定列（由其名称选择）的总和

我的问题是如何创建一个新列，它是dplyr中某些特定列（由其名称选择）的总和 . 例如，使用iris数据集，我创建一个名为Petal的新列，它是Petal.Length和Petal.Width的总和 . iris %>% mutate(Petal = Petal.Length+Petal.Width) 现在假设我有一个20列的数据集，其名称中包含'Petal' . 我想创建一个“Petal...

r dplyr tidyverse
2 votes

answers

views

purrr映射不产生整洁的数据

感谢这个网站，我正在使用R purrr 包来聚合基于多列的数据 . 聚合是我想要的，但输出不是 . 以下是使用 mtcars 数据集的示例 . library(dplyr) library(purrr) #pull in data data <- mtcars #get colnames variable1 <- colnames(data) #map the variables t...

r dplyr tidyverse purrr
2 votes

answers

views

使用purrr映射到2个函数

我有以下表格的数据 date data <chr> <list> 1 2012-01-05 <tibble [796 x 5]> 2 2012-01-12 <tibble [831 x 5]&...

r dplyr tidyverse purrr
3 votes

answers

views

如何在dplyr中用不等列（反向toString）分隔

我正在使用调查数据尝试在一个列中进行多个响应 . 问题是可能有1-5个答案，用逗号分隔 . 我怎么转这个： df <- data.frame( splitThis = c("A,B,C","B,C","A,C","A","B","C") ) > df spl...

r dplyr tidyr tidyverse
2 votes

answers

views

R：用dplyr对行顺序求和

根据here和here这些类似问题的精神，我希望能够在 data_frame 中对一系列列进行求和并创建一个新列： df_abc = data_frame( FJDFjdfF = seq(1:100), FfdfFxfj = seq(1:100), orfOiRFj = seq(1:100), xDGHdj = seq(1:100), jfdIDFF = seq(1:100),...

r dplyr tidyr tidyverse
3 votes

answers

views

dplyr使用变量列进行变异

我正在尝试使用 mutate 创建一个包含基于特定列的值的新列 . 示例最终数据框（我正在尝试创建 new_col ）： x = tibble(colA = c(11, 12, 13), colB = c(91, 92, 93), col_to_use = c("colA", "colA", "colB&...

r dplyr tidyverse nse quosure
1 votes

answers

views

对于带有sigma.formula术语的gamlss模型，无法使用扫帚获得置信区间

我正在调用一个gamlss模型： model <- gamlss(formula = formula("y_variable ~ image_name + random(biological_source_name) - 1"), sigma.formula = formula("~ biological_source_name - 1"...

r tidyverse broom
0 votes

answers

views

R - 合并2个数据帧，其间有时间戳

DF1： structure(list(X = c(113.8577674, 113.8577537, 113.8577403), Y = c(22.19537297, 22.19537222, 22.1953723), Date = c("7/1/2016", "7/1/2016", "7/1/2016"), Tim...

r tidyverse lubridate
2 votes

answers

views

不推荐在tibble上设置行名 . 错误：'row.names'长度无效

我正在尝试制作网站与物种丰度矩阵的热图 . 感谢Maurits Evers的一些代码，我仍然无法在没有错误消息的情况下运行它：不建议在tibble上设置行名 . row.names中的错误< - .data.frame（* tmp *，value = list（Site = c（“AwarukuLower”，：invalid'row.names'length）有人认为tidyver...

r heatmap tidyverse tibble readr
4 votes

answers

views

如何为data.frame的每一行调用一个函数？

我有一个功能有几个参数 . 此函数返回data.frame . 我有另一个data.frame . 现在我想为data.frame的每一行调用我的函数（作为参数） . 结果data.frames我想rbind . 所以我想到了类似的东西 do.call(rbind, apply(df, 1, f)) 是我的朋友 . But: 在此调用期间，df将转换为矩阵 . 在此过程中，所有数字都将转换为字符...

r dataframe tidyverse
4 votes

answers

views

如何避免使用预训练/外部模型在R中使用keras进行图像分类

我有以下代码 . 数据集可以下载here或here . 数据集包含分类为 cat 或 dog 的图像 . 此代码的任务是用于训练猫狗图像数据 . 因此，给定一张图片，它可以判断它是狗还是狗 . 它的动机是page . 以下是完全运行的代码： library(keras) # Organize dataset -------------------------------------------...

r deep-learning keras tidyverse
1 votes

answers

views

使用map和purrr在listcolumn中指定NA

library(tidyverse) k<-data_frame(u=c("A","B"),l=c(list(c(1,5,4)),list(c(7,5,1)))) 我想将listcolumn l中所有低于2的值设置为NA . 我如何使用 Map 在purrr世界中做到这一点？ map(k$l,~.x[.x<2]<-NA) 抛出错...

r dplyr purrr tidyverse

热门问题