Java 学习之路

13 votes

answers

views

tidyr中的隐式排序:: spread和dplyr :: summarize

我的数据是有序观察，我希望在进行操作时尽可能保持顺序 . 得到this question的答案，我把"B"放在数据帧的"A"之前 . 生成的宽数据按"name"列排序，即"A"首先，然后"B" . df = data.frame(name=c("B","B",...

r dplyr data-manipulation tidyr
0 votes

answers

views

合并数据框列表，每个作为因子R [重复]

这个问题在这里已有答案： How to add a index by set of data when using rbindlist? 2个答案所以我有一个包含20个数据帧的列表 . 每个数据框代表一年（1980-2000），我喜欢将我的所有数据框合并为一个，但是有一列表示每个数据框的年份，因此我可以继续按时间操纵 . 所有数据框在列表中具有相同的列名称 . 因此合并不应该很难，但我需要识...

r dataframe merge data-manipulation
0 votes

answers

views

R - 使用多个标识符匹配值（当查找ID的顺序是随机的时）

我的问题是question的后续行动 . 我在这里开了一个新问题 - 因为这与上一个问题截然不同 . 假设我有以下两个数据集： df1 = data.frame(PersonId1=c(1,2,3,4,5,6,7,8,9,10,1),PersonId2=c(11,12,13,14,15,16,17,18,19,20,11), Played_together = c(1,0,0,1...

r data-manipulation data-cleaning
2 votes

answers

views

在R中的ggplot2内操纵数据点的值

我使用代码对某些数据应用了平滑滤镜： ggplot(aes(x = date, y = price), data = df1) + geom_point() + geom_smooth() 我已经为一些数据集做了这个 . 我现在要做的是使平滑线标准化，显示平均价格，以便所有图表的y轴值从100开始 . 为此，我理想地将平滑线的所有数据点除以第一个数据的值指向并乘以100. ie（y / y 1 ...

r ggplot2 dplyr data-manipulation
0 votes

answers

views

使用Pandas处理吞吐量数据

我有多个文件包含测试的吞吐量结果，我想绘制每个文件的带宽随时间的变化 . 我需要将数据帧复制到excel以便可以绘制，是否可以分离数据并仅提取时间和带宽？这是我加载到数据帧中的数据格式 . 如果它更容易，我可以删除数据到[ID]行 . 我正在使用xlsxwtiter来构建一个excel文档 . 这是我用来简单地将txt文件加载到数据帧中的所有代码 . import pandas as pd imp...

python excel pandas data-manipulation
2 votes

answers

views

更改grib文件上的地理配准或地理位置数据

我有一个覆盖全球特定区域的grib文件（即不覆盖整个世界） . 我需要将纬度和经度转换到不同的区域 . 它包含历史天气数据 . 我很难找到一个grib文件包含它的地理参考数据的位置，以及如何操纵它 - 我需要有效地将它的每个点移动到南2度和东经119度 . 任何人都可以指出我可能会使用什么工具来做这个（我正在运行一个mac，并且有我不信任的毕业生，全能（看起来只能查看）和wgrib . 谢谢！

geolocation latitude-longitude data-manipulation grib grads
3 votes

answers

views

如何更改R中的分辨率（或regrid）数据

我有一个由lon，lat和月平均变量（例如温度或降水）组成的数据集，涵盖1961年至1970年 . 数据集的分辨率为0.5 x 0.5度lon / lat，覆盖全球并作为a . 下载 . 我使用以下方法在R中提取数据的NC文件： library(ncdf) f <- open.ncdf("D:/CRU/cru_ts3.21.1961.1970.tmp.dat.nc") A...

r data-manipulation
0 votes

answers

views

如何利用和操纵“RasterBrick”中的土地覆盖图进行R区域加权统计？

我有 TIF 格式的土地覆盖图，可能用于计算德国的面积加权年平均温度 . 我从这里下载了这块土地覆盖 Map 数据（direct download link of land coverage map for Europe） . 特别是，我打算提取城市，农业区的土地/土壤覆盖率数据，反之亦然 . 在我的第一步中，我用 raster 包导入了这个土地覆盖数据 . 以下是我的R脚本： library(r...

r geospatial raster data-manipulation
6 votes

answers

views

使用dplyr或datatable每年的公司数量

让我们说我有数据框： df <- data.frame(City = c("NY", "NY", "NY", "NY", "NY", "LA", "LA", "LA", "LA"), ...

r data.table dplyr data-manipulation
1 votes

answers

views

对日期匹配的列进行求和

我有一个数据框 df1 ，其中包含列ID和日期（作为字符串"XYYYYMMDD"） ID <- c(101,101,101,102,102) date <- c("X20170101","X20170103","X20170106","X20170102","X20170104...

r string dataframe data-manipulation
2 votes

answers

views

使用dplyr中的group_by函数来操作data.frame对象集

这是我向社区提出的第一个问题，我希望通过在这里与有经验的人交流来解决我的疑问 . 我有三个组，每个组包含3个不同的data.frame对象，具有不同的长度和维度 . 我希望通过特定的data.frame对象对它们进行某种操作 . 我认为来自dply包的group_by可以完成这个任务，但是我不确定这个，甚至我还不完全知道使用dplyr包，所以请在我的问题上给你贡献 . 感谢大家 . 这是一个简单的...

r dataframe dplyr data-manipulation
0 votes

answers

views

按顶点属性值过滤igraph对象

mymatrix 是igraph对象（加权邻接矩阵）： > summary(mymatrix) IGRAPH 14317c4 UNW- 810 8761 -- + attr: name (v/c), year (v/n), bad (v/n), new (v/n), weight (e/n) 其中一个节点属性是 year ： > summary(V(mymatrix)$year) ...

r filter igraph data-manipulation adjacency-matrix
0 votes

answers

views

使用第二个数据框重命名R中存在于dataframe [duplicate]中的列

这个问题在这里已有答案： Rename multiple columns by names 13个答案让我先创建一个例子，然后解释一下这个问题： old_names <- c("FG%", "Dist.", "2P", "0-3", "3-10", "10-16") ...

r dplyr data-manipulation
0 votes

answers

views

计算满足某些条件的数据框中的行，并按数据框第一列中的唯一值对它们进行分组

我有一个关于househould id，性别和年龄的数据如下： mydata <- structure(list(ID_HH = c(1,1,1,1,2,2,3,3,3,4,5,5), GENDER = c(1,2,1,1,1,2,2,1,2,2,1,1), AGE = c(5...

r data-manipulation
8 votes

answers

views

使用group by和tidy运行多个模型并将结果提取到数据帧

我想使用 group_by %>% do(tidy(*)) 运行几个线性回归模型并将模型结果提取到数据框 . 每个模型的数据框应包括以下内容：结果变量，暴露变量，样本大小，β系数，SE和p值 . library(tidyverse) data("mtcars") outcomes <- c("wt, mpg", "hp", &...

r linear-regression data-manipulation
0 votes

answers

views

如何操作大型`RasterStack`对象并在R中的纯文本数据中写入所有栅格网格？

当我在处理R中非常大的 RasterStack 对象时，我遇到了一些挑战 . 这是主要的故事，我从欧洲气候评估网站（download site of gridded data和download link of gridded data that I am interested in）下载了网格化数据 . 所以我的第一步是将此数据作为 RasterStack 对象导入R中 . 然后我打算只裁剪特定国...

r raster data-manipulation
1 votes

answers

views

匹配一行中包含多个条目的列并改变结果

我有一个数据框： col_1 <- c("A", "A", "B", "B", "C", "C") col_2 <- c("A", "B", "C", "D", "E"...

r dplyr data-manipulation mutate
0 votes

answers

views

在R中重塑数据帧（融化？）

所以，我目前有一个看起来像这样的数据框： country continent year lifeExp pop gdpPercap <fctr> <fctr> <int> <dbl> <int> <dbl> 1 Afghanistan Asia 1952 28...

r dataframe reshape data-manipulation
6 votes

answers

views

data.table或dplyr - 数据操作

我有以下数据 Date Col1 Col2 2014-01-01 123 12 2014-01-01 123 21 2014-01-01 124 32 2014-01-01 125 32 2014-01-02 123 34 2014-01-02 12...

r data.table plyr data-manipulation dplyr
2 votes

answers

views

根据R中另一个数据帧中的元数据信息组合Dataframe列

我的数据集在概念上与此问题中的数据集类似：Hierarchical indexing in R dataframe但不是这一个：R: Combine columns based on different information in another column of a dataframe 我想根据另一个数据帧中列的元数据信息，通过对它们进行求和来组合（或重新组合）表中的列 . 这是我的数据集的...

r dataframe hierarchical-data data-manipulation
6 votes

answers

views

dplyr：如何以编程方式将full_join数据帧包含在列表列表中？

上下文和数据结构我将与您分享我的庞大数据集的简化版本 . 此简化版本完全尊重原始数据集的结构，但包含的列表元素，数据框架，变量和观察结果比原始数据集少 . 根据对该问题的最热烈回答：How to make a great R reproducible example ?，我使用 dput(query1) 的输出共享我的数据集，通过在R控制台中复制/粘贴以下代码块，为您提供可立即在R中使用的内容：...

r dplyr data-manipulation tidyverse
5 votes

answers

views

使用dplyr从不同的data.frame中提取数据？

我有一个名为dat_new的数据框，基本上是诊所访问数据，hrn是患者ID，而dov是访问日期（每人多次访问） . 然后我有一个名为事件的数据框，其中有过期的住院（每人多次入院） . 我想做的是，对于每次门诊就诊，我想总结在门诊就诊之前发生的住院，简单 . 这适用于plyr的ddply，需要一点时间但效果很好 . temp <- ddply(dat_new, .(hrn,dov), summ...

r plyr data-manipulation dplyr
2 votes

answers

views

如何识别每个群集中的序列？

使用作为 TraMineR 的一部分的生物燃料数据集： library(TraMineR) data(biofam) lab <- c("P","L","M","LM","C","LC","LMC","D") biofam.seq &...

r cluster-analysis data-manipulation traminer
2 votes

answers

views

使用R透视CSV文件

我有一个看起来像这样的文件： type created_at repository_name 1 IssuesEvent 2012-03-11 06:48:31 bootstrap 2 IssuesEvent 2012-03-11 06:48:31 bootstrap 3 IssuesEvent 2012-0...

r csv data-manipulation traminer
3 votes

answers

views

重新排列R中的数据帧

我有一个如下所示的数据框： created_at actor_attributes_email type 3/11/12 7:28 jeremy@asynk.ch PushEvent 3/11/12 7:28 jeremy@asynk.ch PushEvent 3/11/12 7:28 jeremy@asynk.ch P...

r data-manipulation traminer
3 votes

answers

views

最简单的操作栅格数据的方法，用于离散日常温度的年度分布

我在大型 RasterBrick 对象中有德国' historical daily temperature observation (15 years'历史日平均温度的栅格网格数据 . 以下是我的栅格网格化数据的样子： > Temperature_rasterData class : RasterBrick dimensions : 31, 37, 1147, 5479 (...

r raster data-manipulation
6 votes

answers

views

在R中通过多层栅格构建温度分布的任何解决方法

在这里我发现了一个非常有趣的博客：critical threshold in temperature effects和经验方法非常有趣，所以我想在R中实现它的想法 . 但是，我有大型 RasterBrick 对象的德国' historical daily temperatures (15 years'历史日平均温度的多层栅格数据 . 根据inspired post中讨论的经验方法，我需要从我的多层...

r time-series raster data-manipulation

热门问题