首页 文章
  • 0 votes
     answers
     views

    根据列表中data.frame中因子变量的值选择行

    我感觉我很接近,但我无法让它工作,你的帮助将不胜感激 . 我的目标是根据1个因子的值对列表中的数据进行子集化 . 它是关于在不同时间点暴露于刺激的受试者的数据 . 现在我想为每个刺激的所有主题的所有变量的数据进行子集化 . 刺激的变量称为“刺激” . 刺激的名称例如“Happy 8” . 所以示例路径:SubjList $ Subject1 $ Stimulus [“Happy 8”](虽然这也行...
  • 2 votes
     answers
     views

    如何检查集合A是否是R中集合B的子集? [重复]

    这个问题在这里已有答案: How to detect that a vector is subset of specific vector? 3个答案 我有两个集A和B.我想检查集合A是否是集合B的子集 . 我试过我知道R中的集合操作 . 我尝试了交叉,union,setdiff . 但是,没有他们是有帮助的 . 例如, A = c(1, 2, 3, 4) B = c(1, 2, 3, 4,...
  • 2 votes
     answers
     views

    plm中的循环子集

    我似乎做对了 . 我有一个50个国家(1到50)的数据集,每个国家15年,每个国家大约20个变量 . 现在我只在我的因变量( SMD )上测试一个变量( OS ) . 我想用循环国家/地区来做这个,所以我会得到每个国家的产出而不是总产出 . 我认为首先创建一个子集是明智的(能够首先查看国家1,之后我的循环应该增加国家和测试国家2的数量) . 我相信我在页面底部的回归应该会给出国家1的输出,而不是整...
  • 119 votes
     answers
     views

    按逻辑条件过滤data.frame行

    我想根据逻辑条件从 data.frame 过滤行 . 我们假设我有数据框 expr_value cell_type 1 5.345618 bj fibroblast 2 5.195871 bj fibroblast 3 5.247274 bj fibroblast 4 5.929771 hesc 5 5.873096 hes...
  • -1 votes
     answers
     views

    删除R中另一个数据帧中不存在的数据帧中的行[重复]

    这个问题在这里已有答案: Find complement of a data frame (anti - join) 7个答案 How to join (merge) data frames (inner, outer, left, right)? 13个答案 我是R的新手,但从我一直在读的这篇文章对我来说有点困难 . 我有两个数据框,比如DF1和DF2,两者都有一个感兴趣的变量,比如...
  • 1 votes
     answers
     views

    R:使用来自向量的元素对数据帧进行子集化

    我有一个数据框,其中包括一个单独的标识符(6个字母)和数字向量的向量 我想使用从另一个数据帧中获取的元素向量(再次是6个字母的标识符)对其进行子集化 这是我做的(在简化版本中,我的数据框有超过200列和64行) n = c(2, 3, 5, 7, 8, 1) i = c("abazzz", "bbaxxx", "ccbeee",&qu...
  • 6 votes
     answers
     views

    R中向量的子集()

    我已经根据 subset() 编写了以下函数,我发现它很方便: ss <- function (x, subset, ...) { r <- eval(substitute(subset), data.frame(.=x), parent.frame()) if (!is.logical(r)) stop("'subset' must be...
  • 1 votes
     answers
     views

    通过其中一个列的值对数据框进行子集

    我有一个相当大的数据框架 . 这是一个简化的例子: Group Element Value Note 1 AAA 11 Good 1 ABA 12 Good 1 AVA 13 Good 2 CBA 14 Good 2 FDA 14 Good 3 JHA 16 Good...
  • 1 votes
     answers
     views

    如何通过另一个向量对向量进行子集化?

    鉴于这种 data <- list(a=c(1,3,5), b=c(3,4,7,4,8,6), c=c(3,4,8,3,4,8,0)) sample <- c(4,8) 有没有办法检索包含序列 c(4,8) 的列表成员? 在这种情况下,那将是 data$b 和 data$c .
  • 0 votes
     answers
     views

    在R中使用变量字符串条件从数据框中提取行

    将虹膜作为数据框,我想提取所有具有物种作为特定值的行和列变量(Petal.Length,Petal.Width,Sepal.Length,Sepal.Width) . 例如塞托萨 . 它应该显示50个条目 . 我尝试了聚合但没有工作 . 它是SQL中的等效和WHERE子句 .
  • 37 votes
     answers
     views

    子集数据帧由要删除的行的多个逻辑条件

    我想通过指定哪些行( ! )保留在新数据帧中来对数据帧进行子集化(过滤) . 这是一个简化的示例数据框: data v1 v2 v3 v4 a v d c a v d d b n p g b d d h c k d c c r p g d v d x d v d c e v d b e v d c 例如,如果列v1的一行...
  • 76 votes
     answers
     views

    在数据框的选定列中包含NA(缺失)值的行的子集

    我们有一个CSV文件的数据框 . 数据框 DF 包含包含观察值的列和包含测量日期的列( VaR2 ) . 如果未记录日期,则CSV文件包含值 NA ,用于缺少数据 . Var1 Var2 10 2010/01/01 20 NA 30 2010/03/01 我们希望使用subset命令来定义新的数据框 new_DF ,使其仅包含列中具有 NA' 值的行( VaR2 ) . 在给出的...
  • 35 votes
     answers
     views

    子集数据仅包含名称与条件匹配的列

    有没有办法让我根据以特定字符串开头的列名来对数据进行子集化?我有一些列像 ABC_1 ABC_2 ABC_3 ,有些像 XYZ_1, XYZ_2,XYZ_3 让我们说 . 如何仅基于包含上述文本部分的列(例如, ABC 或 XYZ )来对我的 df 进行子集化?我可以使用索引,但是数据中的列太分散,而且编码太多了 . 另外,我想只包含来自这些列的每一行的行,其中任何值都是 >0 所以如果上面...
  • 0 votes
     answers
     views

    子集data.frame为r中的特定条件返回前200行

    我有一个 data.frame ,有330万行和9列 . 以下是3个相关列的示例 . StimulusName Subject Pupil Means 1 1 101 3.270000 2 1 101 3.145000 3 1 101 3.265000 4 ...
  • 6 votes
     answers
     views

    多子集和计算

    我有2套,集合A包含一组随机数,而集合B的元素是集合A的子集的总和 . 例如, A = [8, 9, 15, 15, 33, 36, 39, 45, 46, 60, 68, 73, 80, 92, 96] B = [183, 36, 231, 128, 137] 我想找到哪个数字是哪个子集的总和与这样的数据 . S = [[45, 46, 92], [36], [8, 15, 39, 73, ...
  • 0 votes
     answers
     views

    根据时间顺序子集数据帧

    我有一个名为DF的数据框,列有时间和日期 . 我想根据这些列中的值对DF进行子集化 . 对于日期,我有DATES中的日期列表,并且在DATES中存在DF $ Date的DF行的子集 . 当时,我想从00:04:00到00:06:00进行分组 . 我不知道怎么做后者 . 理想情况下,我希望通过指定范围来进行子集,如00:04:00到00:06:00,以及指定前瞻的起点和分钟,如00:04:00和3分...
  • 1 votes
     answers
     views

    使用R中的多个变量对数据进行子集化

    我有一个数据集,DATA,有很多变量 . DATA具有列表模式,其类是data.frame . 我关心的变量是AGE.MONTHS和LOCATION . 我需要将DATA子集化为另一个名为SUB的集合,并且我希望SUB仅包含AGE.MONTHS <= 2和LOCATION =“Area A”的观察结果 . AGE.MONTHS有一个数字模式和类 . LOCATION有一个数字模式,它的...
  • 4 votes
     answers
     views

    基于列类的列表内的子集数据帧

    我有一个由数据帧组成的非常大的列表,列表的每个元素都是不同的数据帧,其中每列由不同类型的变量和不同长度的数据帧组成 . 我想在这个列表中对数据帧进行子集化,并且只保留那些列具有“整数”或“数字”类,同时保持数据帧结构(所以看似没有“lapply”) . MRE如下: x1 <- c(1,2,3,4) y1 <- c(letters[1:4]) z1 <- as.integer(c...
  • 1 votes
     answers
     views

    丢弃与条件R不匹配的数据帧

    我有一个310 data.frames的列表, mrns[[i]] ,我根据因子的值 mrns[[i]]$ar.cat 进行子集化 . 我能够以一种方式使用它们的子集,使那些与条件不匹配的data.frames留下0观察,但我希望代码只删除这些data.frames而不是留在新的列表为空 . 我的代码是: arlow <- lapply(mrns, function(x) subset(x,...
  • 1 votes
     answers
     views

    具有包含截止而不是排他的子集数据帧

    这应该是一个相当简单的解决方案,但我没有为我的生活能够弄清楚如何解决 . 我有一个列,其中包含基于我的数据的某个因子级别组合的累积比例总和, 例如:0.34,0.57,0.66,0.68,0.73,0.81,0.90,0.97,0.98,0.99, 然后数据移动到下一个因子组合并重置累积总和, 例如:0.27,0.29,0.38,0.56,0.78,0.94,0.96,0.97,0.98等 我用以...
  • 2 votes
     answers
     views

    使用NA搜索更大/更小的值

    我有一个数据框,我已计算并添加了一个 difftime 列: name amount 1st_date 2nd_date days_out JEAN 318.5 1971-02-16 1972-11-27 650 days GREGORY 1518.5 <NA> <NA> NA days JOHN 318.5...
  • 4 votes
     answers
     views

    在ggplot中进行子集化时的因子顺序

    我在x轴上有因子,并以一种直观的方式用ggplot绘制这些因子水平 . 它工作正常 . 但是,当我在ggplot中使用subset命令时,它会重新排序我原始的因子序列 . 是否可以在ggplot中进行子集化并保留因子级别的顺序? 这是数据和代码: library(ggplot2) library(plyr) dat <- structure(list(SubjectID = structur...
  • 12 votes
     answers
     views

    R - 如何根据数据框中一行中的值创建列的子集

    我有一个矩阵,我想分组并最终用于制作情节 . 该数据是群体中每个患者的特定血液标记的计数列表 . 它看起来像这样: df <- data.frame(MarkerID=c("Class","A123","A124"), MarkerName=c("","X",&quo...
  • 40 votes
     answers
     views

    如何根据值向量对R中数据帧中的行进行子集?

    我有两个数据集应该是相同的大小但不是 . 我需要修剪A中不在B中的值,反之亦然,以消除进入报告的图形中的噪声 . (别担心,这些数据没有被永久删除!) 我看过以下内容: Selecting columns in R data frame based on those not in a vector http://www.ats.ucla.edu/stat/r/faq/subset_R.h...
  • 1 votes
     answers
     views

    基于数据帧中的行标签子集igraph稀疏矩阵

    我有一个igraph对象,它基本上是一个稀疏矩阵,其中列和行都用id标记 . 我还有一个带行标签和社区值的数据框 . 我试图通过选择与某个特定值的社区数据框中的行标签匹配的所有行和列来对邻接矩阵进行子集化 . 我已经尝试了匹配,plyr和子集的各种方法,但无法获得任何工作 . 以下是数据的两个子集 . match(g2, communi) >g2[1:3,1:3] 3 x 3 sparse...
  • 1 votes
     answers
     views

    R:按行内容划分的数据帧子集? lapply / sapply

    我有一个数据框列表: d1<-data.frame(a=rnorm(5), b=rep(2006, times=5), cc=c(1:5)) d2<-data.frame(a=rnorm(5), b=rep(2007, times=5), cc=c(1:5)) d3<-data.frame(a=rnorm(5), b=c(2005:2009), cc=c(1:5)) #dat...
  • 1 votes
     answers
     views

    基于行索引拆分数据框

    我想通过循环遍历行和子集来分割我的数据框 indices = (diff(Data$Time>1800)) for (i in 1:length(indices)){ if(indices[i]==TRUE){ ##### I need a function to split data by row index }} 我试过了 lst <- split(Data, as.factor...
  • 0 votes
     answers
     views

    绘制geom_line()和geom_point() - 不同长度的数据

    我试图在ggplot中绘制时间序列,使年度值与geom_line()连接,并且总计在x轴的最右侧显示为单独的geom_point() . 我试图在审美范围内对数据进行子集化,但得到错误: Aesthetics must be either length 1 or the same as the data (1): x, y 我也尝试使用两个不同的数据帧但得到类似的错误 . 对不起,如果这是一个基...
  • 3 votes
     answers
     views

    覆盖[.data.frame以默认删除未使用的因子级别

    在子集化出现时丢弃未使用的因子级别的问题before . 常见的解决方案包括通过声明尽可能使用字符向量 options(stringsAsFactors = FALSE) 但是,有时候,有序因子对于绘图是必要的,在这种情况下,我们可以使用 droplevels 之类的便利函数来为 subset 创建一个包装器: subsetDrop <- function(...){droplevels(...
  • 8 votes
     answers
     views

    优雅的方式从数据框中删除稀有因子水平

    我想按因子对数据帧进行子集化 . 我只想保留高于特定频率的因子水平 . df <- data.frame(factor = c(rep("a",5),rep("b",5),rep("c",2)), variable = rnorm(12)) 此代码创建数据框: factor variable 1 a -1.559...

热门问题