-
6 votesanswersviews
R中向量的子集()
我已经根据 subset() 编写了以下函数,我发现它很方便: ss <- function (x, subset, ...) { r <- eval(substitute(subset), data.frame(.=x), parent.frame()) if (!is.logical(r)) stop("'subset' must be... -
1 votesanswersviews
通过其中一个列的值对数据框进行子集
我有一个相当大的数据框架 . 这是一个简化的例子: Group Element Value Note 1 AAA 11 Good 1 ABA 12 Good 1 AVA 13 Good 2 CBA 14 Good 2 FDA 14 Good 3 JHA 16 Good... -
1 votesanswersviews
如何通过另一个向量对向量进行子集化?
鉴于这种 data <- list(a=c(1,3,5), b=c(3,4,7,4,8,6), c=c(3,4,8,3,4,8,0)) sample <- c(4,8) 有没有办法检索包含序列 c(4,8) 的列表成员? 在这种情况下,那将是 data$b 和 data$c . -
0 votesanswersviews
在R中使用变量字符串条件从数据框中提取行
将虹膜作为数据框,我想提取所有具有物种作为特定值的行和列变量(Petal.Length,Petal.Width,Sepal.Length,Sepal.Width) . 例如塞托萨 . 它应该显示50个条目 . 我尝试了聚合但没有工作 . 它是SQL中的等效和WHERE子句 . -
37 votesanswersviews
子集数据帧由要删除的行的多个逻辑条件
我想通过指定哪些行( ! )保留在新数据帧中来对数据帧进行子集化(过滤) . 这是一个简化的示例数据框: data v1 v2 v3 v4 a v d c a v d d b n p g b d d h c k d c c r p g d v d x d v d c e v d b e v d c 例如,如果列v1的一行... -
76 votesanswersviews
在数据框的选定列中包含NA(缺失)值的行的子集
我们有一个CSV文件的数据框 . 数据框 DF 包含包含观察值的列和包含测量日期的列( VaR2 ) . 如果未记录日期,则CSV文件包含值 NA ,用于缺少数据 . Var1 Var2 10 2010/01/01 20 NA 30 2010/03/01 我们希望使用subset命令来定义新的数据框 new_DF ,使其仅包含列中具有 NA' 值的行( VaR2 ) . 在给出的... -
35 votesanswersviews
子集数据仅包含名称与条件匹配的列
有没有办法让我根据以特定字符串开头的列名来对数据进行子集化?我有一些列像 ABC_1 ABC_2 ABC_3 ,有些像 XYZ_1, XYZ_2,XYZ_3 让我们说 . 如何仅基于包含上述文本部分的列(例如, ABC 或 XYZ )来对我的 df 进行子集化?我可以使用索引,但是数据中的列太分散,而且编码太多了 . 另外,我想只包含来自这些列的每一行的行,其中任何值都是 >0 所以如果上面... -
0 votesanswersviews
子集data.frame为r中的特定条件返回前200行
我有一个 data.frame ,有330万行和9列 . 以下是3个相关列的示例 . StimulusName Subject Pupil Means 1 1 101 3.270000 2 1 101 3.145000 3 1 101 3.265000 4 ... -
12 votesanswersviews
R - 如何根据数据框中一行中的值创建列的子集
我有一个矩阵,我想分组并最终用于制作情节 . 该数据是群体中每个患者的特定血液标记的计数列表 . 它看起来像这样: df <- data.frame(MarkerID=c("Class","A123","A124"), MarkerName=c("","X",&quo... -
40 votesanswersviews
如何根据值向量对R中数据帧中的行进行子集?
我有两个数据集应该是相同的大小但不是 . 我需要修剪A中不在B中的值,反之亦然,以消除进入报告的图形中的噪声 . (别担心,这些数据没有被永久删除!) 我看过以下内容: Selecting columns in R data frame based on those not in a vector http://www.ats.ucla.edu/stat/r/faq/subset_R.h... -
1 votesanswersviews
基于数据帧中的行标签子集igraph稀疏矩阵
我有一个igraph对象,它基本上是一个稀疏矩阵,其中列和行都用id标记 . 我还有一个带行标签和社区值的数据框 . 我试图通过选择与某个特定值的社区数据框中的行标签匹配的所有行和列来对邻接矩阵进行子集化 . 我已经尝试了匹配,plyr和子集的各种方法,但无法获得任何工作 . 以下是数据的两个子集 . match(g2, communi) >g2[1:3,1:3] 3 x 3 sparse... -
1 votesanswersviews
R:按行内容划分的数据帧子集? lapply / sapply
我有一个数据框列表: d1<-data.frame(a=rnorm(5), b=rep(2006, times=5), cc=c(1:5)) d2<-data.frame(a=rnorm(5), b=rep(2007, times=5), cc=c(1:5)) d3<-data.frame(a=rnorm(5), b=c(2005:2009), cc=c(1:5)) #dat... -
1 votesanswersviews
基于行索引拆分数据框
我想通过循环遍历行和子集来分割我的数据框 indices = (diff(Data$Time>1800)) for (i in 1:length(indices)){ if(indices[i]==TRUE){ ##### I need a function to split data by row index }} 我试过了 lst <- split(Data, as.factor... -
4 votesanswersviews
设置矩阵值与R中的矢量进行比较
我想在矩阵的每个元素中设置NA,其中列中的值大于或等于给定向量的值 . 例如,我可以创建一个矩阵: set.seed(1) zz <- matrix(data = round(10L * runif(12)), nrow = 4, ncol = 3) 给zz: [,1] [,2] [,3] [1,] 8 5 7 [2,] 6 5 1 [3,] 5 ... -
6 votesanswersviews
多子集和计算
我有2套,集合A包含一组随机数,而集合B的元素是集合A的子集的总和 . 例如, A = [8, 9, 15, 15, 33, 36, 39, 45, 46, 60, 68, 73, 80, 92, 96] B = [183, 36, 231, 128, 137] 我想找到哪个数字是哪个子集的总和与这样的数据 . S = [[45, 46, 92], [36], [8, 15, 39, 73, ... -
2 votesanswersviews
Plyr / data.table子集
我的数据排列方式是在单独的列中包含日/月/年(这对于我需要如何对数据进行子集化非常有用) . 除D / M / Y之外的每列都是值列 . 在我的真实数据中,这些是美国的县 . 我需要根据不同的日,月和年组合来总结不同的日期范围 . 鉴于每列都是一个县,ddply / data.table / apply函数似乎最适合解决问题 . 但是,我无法弄清楚如何对数据进行子集化 . 这是一个简单的例子: s... -
1 votesanswersviews
Fitted vs Residuals图中的对角线?
我有一个世界恐怖事件的数据集(来自全球恐怖主义数据库) . 我在下面构建了一个衬管模型,并绘制了拟合与残差,但我在图中得到了一条突出的对角线 . 为什么?如何删除它? lmods<-lm(Iraq.incidents~Afghanistan.incidents+Pakistan.incidents+France.incidents+`United Kingdom.incidents`+`Un... -
1 votesanswersviews
使用R中的多个变量对数据进行子集化
我有一个数据集,DATA,有很多变量 . DATA具有列表模式,其类是data.frame . 我关心的变量是AGE.MONTHS和LOCATION . 我需要将DATA子集化为另一个名为SUB的集合,并且我希望SUB仅包含AGE.MONTHS <= 2和LOCATION =“Area A”的观察结果 . AGE.MONTHS有一个数字模式和类 . LOCATION有一个数字模式,它的... -
4 votesanswersviews
基于列类的列表内的子集数据帧
我有一个由数据帧组成的非常大的列表,列表的每个元素都是不同的数据帧,其中每列由不同类型的变量和不同长度的数据帧组成 . 我想在这个列表中对数据帧进行子集化,并且只保留那些列具有“整数”或“数字”类,同时保持数据帧结构(所以看似没有“lapply”) . MRE如下: x1 <- c(1,2,3,4) y1 <- c(letters[1:4]) z1 <- as.integer(c... -
1 votesanswersviews
丢弃与条件R不匹配的数据帧
我有一个310 data.frames的列表, mrns[[i]] ,我根据因子的值 mrns[[i]]$ar.cat 进行子集化 . 我能够以一种方式使用它们的子集,使那些与条件不匹配的data.frames留下0观察,但我希望代码只删除这些data.frames而不是留在新的列表为空 . 我的代码是: arlow <- lapply(mrns, function(x) subset(x,... -
0 votesanswersviews
使用dplyr独立的数据集中的子集变量
我想使用dplyr复制以下内容 . set.seed(123) my_data <- data.frame( time = c(4:13, 4:13), var1 = rep(c("a", "b"), each=10), var2 = rnorm(20)) ... -
3 votesanswersviews
使用ggplot2在dplyr链中进行子集/过滤
我想制作一个斜率图,沿着this的线条(没有双关语) . 理想情况下,我想在dplyr风格的链中完成所有操作,但是当我尝试将数据子集化以添加特定的 geom_text 标签时,我遇到了麻烦 . 这是一个玩具示例: # make tbl: df <- tibble( area = rep(c("Health", "Education"), 6), ... -
1 votesanswersviews
使用dplyr过滤条件对数据集进行子集化
我想将数据框子集化以收集来自所有列的信息 . 我将使用 msleep 数据集解释该问题 . library(msleep) 我查看了列 genus 频率的频率来查看频率的分布 . msleep %>% count(genus) %>% count(n) ## A tibble: 3 × 2 # n nn # <int> <int> #1 ... -
0 votesanswersviews
基于DPLYR的多个子集
以下数据框包含有关营销活动的数据 . Sl No Success_Percentage communication_type Message 1 35.46666667 email Hello, Buy New Product 2 32.32830821 email Hi Bu... -
1 votesanswersviews
使用两列中的值子集pandas数据帧
我正在尝试根据两列的值对pandas数据帧进行子集化 . 我试过这段代码: df[df['gold']>0, df['silver']>0, df['bronze']>0] 但是这没用 . 我也尝试过: df[(df['gold']>0 and df['silver']>0) . 这也行不通 . 我收到一个错误说: ValueError:系列的真值是不明确的 . ... -
2 votesanswersviews
如何根据输入选择在光泽中使用传单对数据帧进行子集化和绘图
使用Rstudio我试图制作一个产生传单输出的闪亮应用程序 . 请注意,闪亮是我之前没有使用的包,因此脚本中可能存在其他错误,而不是我目前遇到的错误 . 我正在使用一个数据帧,其中包含不同个体的轨迹,我希望将其分组并绘制一个动物的轨迹以响应输入选择 . Sample: WhaleID lat long gm08_150c 68,4276 16,5192 gm08_15... -
0 votesanswersviews
从另一个创建一个新的Data.table并匹配一个变量的向量列表
我有一个带有 2.7 million observations 和 21 variables 的data.table,需要生成一个新的data.table,其中 Variable 1 与 vector of values 匹配 . 我有一些值的向量与一些Variable1值匹配,如下所示 VectorValue= (A, B, XXZ, UDD...) 我想的是: Table_B <- ... -
0 votesanswersviews
R使用相同尺寸的表
我有两张4x4尺寸的 table . 我想知道如果底部表的相应单元格中有0,我可以用0替换第一个表中的单元格(使用R命令,我猜一个If语句或子设置) . 例如,第一个表(-0.2)的第一行和第一列应该根据第二个表(-0.2)的第一行和第0列的0值转换为零?谢谢 第一张 table -0.2,0.5,0.8,0.01,1,-0.4,0.8,0.5,0.5,0.3,-0.1,0.8,-0.8,0.5... -
0 votesanswersviews
绘制geom_line()和geom_point() - 不同长度的数据
我试图在ggplot中绘制时间序列,使年度值与geom_line()连接,并且总计在x轴的最右侧显示为单独的geom_point() . 我试图在审美范围内对数据进行子集化,但得到错误: Aesthetics must be either length 1 or the same as the data (1): x, y 我也尝试使用两个不同的数据帧但得到类似的错误 . 对不起,如果这是一个基... -
3 votesanswersviews
覆盖[.data.frame以默认删除未使用的因子级别
在子集化出现时丢弃未使用的因子级别的问题before . 常见的解决方案包括通过声明尽可能使用字符向量 options(stringsAsFactors = FALSE) 但是,有时候,有序因子对于绘图是必要的,在这种情况下,我们可以使用 droplevels 之类的便利函数来为 subset 创建一个包装器: subsetDrop <- function(...){droplevels(...