-
13 votesanswersviews
tidyr中的隐式排序:: spread和dplyr :: summarize
我的数据是有序观察,我希望在进行操作时尽可能保持顺序 . 得到this question的答案,我把"B"放在数据帧的"A"之前 . 生成的宽数据按"name"列排序,即"A"首先,然后"B" . df = data.frame(name=c("B","B",... -
0 votesanswersviews
合并数据框列表,每个作为因子R [重复]
这个问题在这里已有答案: How to add a index by set of data when using rbindlist? 2个答案 所以我有一个包含20个数据帧的列表 . 每个数据框代表一年(1980-2000),我喜欢将我的所有数据框合并为一个,但是有一列表示每个数据框的年份,因此我可以继续按时间操纵 . 所有数据框在列表中具有相同的列名称 . 因此合并不应该很难,但我需要识... -
0 votesanswersviews
R - 使用多个标识符匹配值(当查找ID的顺序是随机的时)
我的问题是question的后续行动 . 我在这里开了一个新问题 - 因为这与上一个问题截然不同 . 假设我有以下两个数据集: df1 = data.frame(PersonId1=c(1,2,3,4,5,6,7,8,9,10,1),PersonId2=c(11,12,13,14,15,16,17,18,19,20,11), Played_together = c(1,0,0,1... -
2 votesanswersviews
在R中的ggplot2内操纵数据点的值
我使用代码对某些数据应用了平滑滤镜: ggplot(aes(x = date, y = price), data = df1) + geom_point() + geom_smooth() 我已经为一些数据集做了这个 . 我现在要做的是使平滑线标准化,显示平均价格,以便所有图表的y轴值从100开始 . 为此,我理想地将平滑线的所有数据点除以第一个数据的值指向并乘以100. ie(y / y 1 ... -
0 votesanswersviews
使用Pandas处理吞吐量数据
我有多个文件包含测试的吞吐量结果,我想绘制每个文件的带宽随时间的变化 . 我需要将数据帧复制到excel以便可以绘制,是否可以分离数据并仅提取时间和带宽?这是我加载到数据帧中的数据格式 . 如果它更容易,我可以删除数据到[ID]行 . 我正在使用xlsxwtiter来构建一个excel文档 . 这是我用来简单地将txt文件加载到数据帧中的所有代码 . import pandas as pd imp... -
2 votesanswersviews
更改grib文件上的地理配准或地理位置数据
我有一个覆盖全球特定区域的grib文件(即不覆盖整个世界) . 我需要将纬度和经度转换到不同的区域 . 它包含历史天气数据 . 我很难找到一个grib文件包含它的地理参考数据的位置,以及如何操纵它 - 我需要有效地将它的每个点移动到南2度和东经119度 . 任何人都可以指出我可能会使用什么工具来做这个(我正在运行一个mac,并且有我不信任的毕业生,全能(看起来只能查看)和wgrib . 谢谢! -
3 votesanswersviews
如何更改R中的分辨率(或regrid)数据
我有一个由lon,lat和月平均变量(例如温度或降水)组成的数据集,涵盖1961年至1970年 . 数据集的分辨率为0.5 x 0.5度lon / lat,覆盖全球并作为a . 下载 . 我使用以下方法在R中提取数据的NC文件: library(ncdf) f <- open.ncdf("D:/CRU/cru_ts3.21.1961.1970.tmp.dat.nc") A... -
0 votesanswersviews
如何利用和操纵“RasterBrick”中的土地覆盖图进行R区域加权统计?
我有 TIF 格式的土地覆盖图,可能用于计算德国的面积加权年平均温度 . 我从这里下载了这块土地覆盖 Map 数据(direct download link of land coverage map for Europe) . 特别是,我打算提取城市,农业区的土地/土壤覆盖率数据,反之亦然 . 在我的第一步中,我用 raster 包导入了这个土地覆盖数据 . 以下是我的R脚本: library(r... -
6 votesanswersviews
使用dplyr或datatable每年的公司数量
让我们说我有数据框: df <- data.frame(City = c("NY", "NY", "NY", "NY", "NY", "LA", "LA", "LA", "LA"), ... -
1 votesanswersviews
对日期匹配的列进行求和
我有一个数据框 df1 ,其中包含列ID和日期(作为字符串"XYYYYMMDD") ID <- c(101,101,101,102,102) date <- c("X20170101","X20170103","X20170106","X20170102","X20170104... -
2 votesanswersviews
使用dplyr中的group_by函数来操作data.frame对象集
这是我向社区提出的第一个问题,我希望通过在这里与有经验的人交流来解决我的疑问 . 我有三个组,每个组包含3个不同的data.frame对象,具有不同的长度和维度 . 我希望通过特定的data.frame对象对它们进行某种操作 . 我认为来自dply包的group_by可以完成这个任务,但是我不确定这个,甚至我还不完全知道使用dplyr包,所以请在我的问题上给你贡献 . 感谢大家 . 这是一个简单的... -
0 votesanswersviews
按顶点属性值过滤igraph对象
mymatrix 是igraph对象(加权邻接矩阵): > summary(mymatrix) IGRAPH 14317c4 UNW- 810 8761 -- + attr: name (v/c), year (v/n), bad (v/n), new (v/n), weight (e/n) 其中一个节点属性是 year : > summary(V(mymatrix)$year) ... -
0 votesanswersviews
使用第二个数据框重命名R中存在于dataframe [duplicate]中的列
这个问题在这里已有答案: Rename multiple columns by names 13个答案 让我先创建一个例子,然后解释一下这个问题: old_names <- c("FG%", "Dist.", "2P", "0-3", "3-10", "10-16") ... -
0 votesanswersviews
计算满足某些条件的数据框中的行,并按数据框第一列中的唯一值对它们进行分组
我有一个关于househould id,性别和年龄的数据如下: mydata <- structure(list(ID_HH = c(1,1,1,1,2,2,3,3,3,4,5,5), GENDER = c(1,2,1,1,1,2,2,1,2,2,1,1), AGE = c(5... -
8 votesanswersviews
使用group by和tidy运行多个模型并将结果提取到数据帧
我想使用 group_by %>% do(tidy(*)) 运行几个线性回归模型并将模型结果提取到数据框 . 每个模型的数据框应包括以下内容:结果变量,暴露变量,样本大小,β系数,SE和p值 . library(tidyverse) data("mtcars") outcomes <- c("wt, mpg", "hp", &... -
0 votesanswersviews
如何操作大型`RasterStack`对象并在R中的纯文本数据中写入所有栅格网格?
当我在处理R中非常大的 RasterStack 对象时,我遇到了一些挑战 . 这是主要的故事,我从欧洲气候评估网站(download site of gridded data和download link of gridded data that I am interested in)下载了网格化数据 . 所以我的第一步是将此数据作为 RasterStack 对象导入R中 . 然后我打算只裁剪特定国... -
1 votesanswersviews
匹配一行中包含多个条目的列并改变结果
我有一个数据框: col_1 <- c("A", "A", "B", "B", "C", "C") col_2 <- c("A", "B", "C", "D", "E"... -
0 votesanswersviews
在R中重塑数据帧(融化?)
所以,我目前有一个看起来像这样的数据框: country continent year lifeExp pop gdpPercap <fctr> <fctr> <int> <dbl> <int> <dbl> 1 Afghanistan Asia 1952 28... -
6 votesanswersviews
data.table或dplyr - 数据操作
我有以下数据 Date Col1 Col2 2014-01-01 123 12 2014-01-01 123 21 2014-01-01 124 32 2014-01-01 125 32 2014-01-02 123 34 2014-01-02 12... -
2 votesanswersviews
根据R中另一个数据帧中的元数据信息组合Dataframe列
我的数据集在概念上与此问题中的数据集类似:Hierarchical indexing in R dataframe但不是这一个:R: Combine columns based on different information in another column of a dataframe 我想根据另一个数据帧中列的元数据信息,通过对它们进行求和来组合(或重新组合)表中的列 . 这是我的数据集的... -
6 votesanswersviews
dplyr:如何以编程方式将full_join数据帧包含在列表列表中?
上下文和数据结构 我将与您分享我的庞大数据集的简化版本 . 此简化版本完全尊重原始数据集的结构,但包含的列表元素,数据框架,变量和观察结果比原始数据集少 . 根据对该问题的最热烈回答:How to make a great R reproducible example ?,我使用 dput(query1) 的输出共享我的数据集,通过在R控制台中复制/粘贴以下代码块,为您提供可立即在R中使用的内容:... -
5 votesanswersviews
使用dplyr从不同的data.frame中提取数据?
我有一个名为dat_new的数据框,基本上是诊所访问数据,hrn是患者ID,而dov是访问日期(每人多次访问) . 然后我有一个名为事件的数据框,其中有过期的住院(每人多次入院) . 我想做的是,对于每次门诊就诊,我想总结在门诊就诊之前发生的住院,简单 . 这适用于plyr的ddply,需要一点时间但效果很好 . temp <- ddply(dat_new, .(hrn,dov), summ... -
2 votesanswersviews
如何识别每个群集中的序列?
使用作为 TraMineR 的一部分的生物燃料数据集: library(TraMineR) data(biofam) lab <- c("P","L","M","LM","C","LC","LMC","D") biofam.seq &... -
2 votesanswersviews
使用R透视CSV文件
我有一个看起来像这样的文件: type created_at repository_name 1 IssuesEvent 2012-03-11 06:48:31 bootstrap 2 IssuesEvent 2012-03-11 06:48:31 bootstrap 3 IssuesEvent 2012-0... -
3 votesanswersviews
重新排列R中的数据帧
我有一个如下所示的数据框: created_at actor_attributes_email type 3/11/12 7:28 jeremy@asynk.ch PushEvent 3/11/12 7:28 jeremy@asynk.ch PushEvent 3/11/12 7:28 jeremy@asynk.ch P... -
3 votesanswersviews
最简单的操作栅格数据的方法,用于离散日常温度的年度分布
我在大型 RasterBrick 对象中有德国' historical daily temperature observation (15 years'历史日平均温度的栅格网格数据 . 以下是我的栅格网格化数据的样子: > Temperature_rasterData class : RasterBrick dimensions : 31, 37, 1147, 5479 (... -
6 votesanswersviews
在R中通过多层栅格构建温度分布的任何解决方法
在这里我发现了一个非常有趣的博客:critical threshold in temperature effects和经验方法非常有趣,所以我想在R中实现它的想法 . 但是,我有大型 RasterBrick 对象的德国' historical daily temperatures (15 years'历史日平均温度的多层栅格数据 . 根据inspired post中讨论的经验方法,我需要从我的多层...