-
19 votesanswersviews
R基于多个列值将数据帧子集化为多个数据帧
我正在尝试对数据帧进行子集化,其中我基于多个列值获得多个数据帧 . 这是我的例子 >df v1 v2 v3 v4 v5 A Z 1 10 12 D Y 10 12 8 E X 2 12 15 A Z 1 10 12 E X 2 14 ... -
4 votesanswersviews
子集行基于特定阈值
我希望根据阈值获得数据框的列观察的子集 . 我会用更多细节向你解释这个问题 . 我有一个数据框架,其中35名患者的甲基化水平被肺腺癌感染 . 这是我数据的一个子集: > df.met[1:5,1:5] A2BP1 A2M A2ML1 A4GALT AAAS paciente6 0.36184475 0.4555788 ... -
0 votesanswersviews
基于一列的条件对数据帧进行子集化[重复]
这个问题在这里已有答案: Filter data.frame rows by a logical condition 8个答案 我有一个很大的数据框架 . 我想根据一列值的条件制作一个子集 . 说: a<-data.frame(x=rep(1:5,5),y=rnorm(25),z=runif(25)) 我想根据列 x 的值创建一个子集 . 例如,获取 x=c(2,3,5) 的值并创建另一... -
0 votesanswersviews
通过向量子集化数据帧:删除分位数
这是关于通过向量对数据帧进行子集化的先前问题的更复杂的迭代 . 所以在这种情况下,我有一个非常大的数据框,其中包含许多作物数据列 . 在该数据帧中有一个名为“STshort”的列,其中包含许多尾部错误 . 我想从此列中删除上限10%和下限10%的值,并按以下方式尝试 . 首先,我为列“STshort”创建一个对象,如下所示 . sh<-Maindata[,"STShort"... -
0 votesanswersviews
基于单独的Dataframe(R)的子集数据
我知道之前已经问过这个问题的变体,我尝试过(Select rows from a data frame based on values in a vector)和(subset a column in data frame based on another data frame/list)的解决方案,但我无法使这些解决方案有效 . 解决方案继续返回具有0个观察值的数据帧 . 我的第一个数据框看起来... -
2 votesanswersviews
基于向量中的搜索模式对数据帧进行子集化
我花了几个小时来解决基于向量中的搜索模式对数据帧行进行子集化的问题 . 我是R.的新手 . 也许这很容易,但我不能自己做,我无法在stackoverflow中找到解决方案 假设我有来自R的mtcars数据 . 我想用几个汽车名称来配置行,例如只有马自达,福特和雪佛兰 . 所以我有一个字符向量car.names,其中包含我想要分组的汽车名称: car.names <- c("Mazd... -
1 votesanswersviews
根据列名称的多个条件提取数据框列
我想基于多个列名标准对数据框进行子集化 . 我有一个数据框如下: id team_col_code1 team_col_code2 ... team_col_code78 Gender State team_cost_code1 team_cost_code2 ... team_cost_code43 我正在尝试对此数据框进行子集,以便新数据集仅包含包含包含单词 "col... -
-2 votesanswersviews
使用$动态选择数据框列
我试图从数据帧动态选择列 . 假设我有一个列名称向量,需要将其传递给数据帧 df_test$c1$c2$c3 这里c2是我试图动态传递的 . 我在stackoverflow Dynamically select data frame columns using $ and a vector of column names中发现了一个类似的问题,但这只涉及df_test $ c1并动态传递c1 .... -
3 votesanswersviews
将一个数据帧的列中的值与另一个数据帧中的列的子集进行匹配
我试图将一个数据帧的列中的值与第二个数据帧的列中的值进行匹配 . 棘手的部分是我想使用第二个数据帧的子集进行匹配(由第二个数据帧中与正在匹配的数据帧中的不同列指定) . 这与基于数据帧之间的匹配尝试子集的常见问题不同 . 我的问题恰恰相反 - 我想根据子集匹配数据帧 . 具体来说,我想将第二个数据帧中列的子集与第一个数据帧的整个列匹配,然后在第一个数据帧中创建新列,显示是否已为每个数据帧进行匹配子... -
0 votesanswersviews
用于在R中绘制iGraph的子集数据框
我正在研究下面显示的数据框架 . S.no tmp size 1 tmp1 100 2 tmp2, tmp3 200 3 tmp1, tmp2, tmp3 50 我想要做的是绘制一个igraph图,其中每个tmp是一个顶点并且到达边缘,每一行中的tm... -
15 votesanswersviews
从数据框创建稀疏矩阵
我正在做一项任务,我正在尝试为Netflix奖品数据构建一个协作过滤模型 . 我正在使用的数据是一个CSV文件,我很容易将其导入数据框 . 现在我需要做的是创建一个稀疏矩阵,由用户组成行,电影作为列,每个单元格由相应的评级值填充 . 当我尝试绘制数据框中的值时,我需要为数据框中的每一行运行一个循环,这在R中花费了大量时间,请任何人都可以提出更好的方法 . 以下是示例代码和数据: buildUser... -
0 votesanswersviews
如何为数据框行的子集的列分配值
我有一个大型数据框,我正在尝试为特定子集的特定数据列分配值 . subset(P2Y12R_binding_summary,(SYSTEM=="4NTJ")&(VARIANT=="D294N")) SYSTEM VARIANT MODEL EPSIN INP dE_water_free dE_ERR_water_free dE_water_pe... -
4 votesanswersviews
具有逻辑值矩阵的子集数据帧
Problem 我有四个人的数据,每个人都有四种不同的格式 . 措施是 x 和 y ,个人是 A, B, C, D . 数据框看起来像这样 d <- data.frame(matrix(sample(1:100, 40, replace = F), ncol = 8)) colnames(d) <- paste(rep(c("x.", "y."... -
11 votesanswersviews
基于另一个数据帧/列表在数据帧中子集一列
我有以下 table1 ,这是一个由6列和8083行组成的数据框 . 下面我显示了这个 table1 的头部: |gene ID | prom_65| prom_66| amast_69| amast_70| p_value| |:--------------|---------:|---------:|---------:|---------:|---------:... -
0 votesanswersviews
使用顺序向量中的值获取R数据帧的子集
我有一个相关分数矢量 myCorVector ,其中包含从1到-1的一系列值 . 向量 myCorVector 具有数据帧 myDataFrame 的每一行的分数 . 我可以通过指定 myDataFrame[order(myCorVector),] 来订购数据框行 . 我想要做的是订购数据框,但从 myDataFrame 检索行的子集,其中 myCorVector 值小于0 . 如果我在 myCo... -
4 votesanswersviews
通过不同的向量乘以数据帧的各种子集
我想用数值向量乘以数据框中的几列 . 值的特定向量根据另一列中的值而变化 . 编辑 - 如果我使数据集更复杂,即超过2个条件并且条件在数据集周围随机混乱,该怎么办? 以下是我的数据集示例: df=data.frame( Treatment=(rep(LETTERS[1:4],each=2)), Species=rep(1:4,each=2), Value1=c(0,0,1,3,4,... -
-1 votesanswersviews
如何以向量化方式将函数应用于数据子集[重复]
这个问题在这里已有答案: Grouping functions (tapply, by, aggregate) and the *apply family 9个答案 Question: 如何以矢量化方式将函数应用于数据子集 . Example: 对于以下数据框: x=c(1,2,1,2,1,2) y=c(3,4,5,4,3,2) df=data.frame(x,y) 我想对每个x值的所有y值... -
1 votesanswersviews
R子集数据帧由两个向量组成
我有一个数据框和两个名为 left 和 right 的整数向量 . 我想以这样的方式创建数据帧的子集,使得向量中的数字将指示要包括在子集中的列的范围 . 例如,对于数据框中的第n行,我想保留值 df[n,left[n]:right[n] . 我尝试使用 mapply() 这样做: aligned_rows<-apply(df,1, function(x) m... -
2 votesanswersviews
使用向量替换行子集的列值
我正在尝试使用向量的值替换数据帧中的行子集(值<6)的列(簇)的值 . df <- structure(list(value = c(1, 2, 3, 4, 5, 6, 7, 8, 9, 10), cluster = c(0, 0, 0, 0, 0, 0, 0, 0, 0, 0)), .Names = c("value", "cluster")... -
1 votesanswersviews
使用lapply / sapply重新计算数据框中的每个点
我编写了自己的名为batcheffect的函数来重新计算数据帧中的所有值 . 该函数只需要将数据帧作为导入 . 首先,在函数中计算平均值,然后对数据帧中的每个点进行计算并创建新的数据帧 . batcheffect <- function (experiment){ corr<-list() matrixexp<-as.matrix(experiment... -
0 votesanswersviews
使用sapply查找列表顺序停留在因子上
我使用sapply编写了一个函数,它接受数据框列的元素并重命名它们 . 我这样做是使用查找列表和sapply . 奇怪的是,我把东西放在查找列表中的顺序改变了输出 . 这是我的例子: this.frame <- cbind(c("AAA", "BBB", "CCC", "AAA", "BBB"... -
-2 votesanswersviews
R子集数据框中的错误然后使用sapply
我试图在数据框中对数据组(县)进行回归(lm) . 但是,我首先想要过滤该数据帧(dat)以排除一些数据点太少的组 . 只要我不首先对数据框进行子集化,我就能让一切正常工作: tmp1 <- with(dat, by(dat, County, function(x) lm(formula = Y ~ A + B + C, data=x))) sapply(tmp1,... -
1 votesanswersviews
仅在某些变量/嵌套循环中使用lapply中的sapply
我想分两步解决我的问题,以便让我更好地理解编码方式 . Part 1: 假设我有一个这样的列表: x <- data.frame(replicate(5,sample(0:100,10,rep=TRUE))) y <- data.frame(replicate(5,sample(0:100,10,rep=TRUE))) z <- list(x, y) 我想获得每个列表中每列... -
1 votesanswersviews
使用lapply和子集的子集数据帧
我有这个数据框: structure(list(ABEV3 = c(15.2, 14.9, 15.22, 15.15, 15.18, 15.46, 15.49, 15.5, 15.37, 15.49, 15.64, 15.38, 15.3, 15.01, 14.75, 14.9, 14.77, 14.61, 14.21, 14.07, 14.1, 14.17, 14.55, 14.57, 1... -
62 votesanswersviews
查找重复行的索引[重复]
这个问题在这里已有答案: Finding ALL duplicate rows, including “elements with smaller subscripts” 3个答案 R中复制的函数执行重复行搜索 . 如果我们想删除重复项,我们只需要编写 df[!duplicated(df),] ,并且将从数据框中删除重复项 . 但是如何找到重复数据的索引呢?如果 duplicated 在某行上... -
0 votesanswersviews
拆分数据框并有新的行号
当我将数据分成两个新数据帧时,两个新数据帧的行号将索引原始数据帧 . 例如,如果 dfA 的行号为1,2,3,4;我想基于交替的行创建两个新的数据帧(因此行1和3转到 dfB ,行2和4转到 dfC ) . 但我希望行号在 dfB 和 dfC 中有新索引,因此实际上 dfB 和 dfC 都有1和2作为行索引 . 这是一个问题的原因是,当我将(实际上更大的df)分成 A 和 B 时,每当我尝试访问特... -
1 votesanswersviews
按行拆分数据框并保存为csv
我只有一个数据框,并希望按行拆分数据帧,将几个新数据帧分配给新变量并将它们保存为csv文件 . a <- rep(1:5,each=3) b <-rep(1:3,each=5) c <- data.frame(a,b) # a b 1 1 1 2 1 1 3 1 1 4 2 1 5 2 1 6 2 2 7 3 2 8 3 2 9 3 2 10 4 2 11 ... -
5 votesanswersviews
使用ggplot在同一图中对两个直方图进行排序
我有一个问题,我无法找到解决方案 . 我有一个数据框,有不同的形容词和分词,有两种不同的模式 . head(THAT_EXT_COMBINED) ID PATTERN NODE 1 HRE_721_03 THAT_EXT accepted 2 G08_1321_01 THAT_EXT acknowledged 3 AAW_47_03 THAT_E... -
2 votesanswersviews
绘制连续变量的两个直方图,其中条彼此相邻而不是重叠
我试图在一个图中绘制两个直方图,但这两个组的分布方式使得直方图有点难以解释 . 我的直方图现在看起来像这样: 这是我的代码: hist(GROUP1, col=rgb(0,0,1,1/2), breaks=100, freq=FALSE,xlab="X",main="") # first histogram hist(GROUP1, col=rgb(1,... -
2 votesanswersviews
用R绘制直方图; y轴从比例/概率不断变化到频率
我尝试在同一平面上叠加两个直方图,但hist()中的选项Probability = TRUE(相对频率)对下面的代码无效 . 这是一个问题,因为两个样本具有非常不同的大小(长度(cl1)= 9和长度(cl2)= 339),并且,使用此脚本,我无法对两个直方图之间的差异进行视觉化,因为每个都显示频率 . 如何以相同的箱宽度重叠两个直方图,显示相对频率? c1<-hist(dataList[[&...