-
3 votesanswersviews
在存储在硬盘驱动器上的非常大的数据集上训练SVM
存在一个非常大的自己收集的大小为 [2000000 12672] 的数据集,其中行显示实例数和列数,即要素数 . 此数据集占用本地硬盘上的 ~60 Gigabyte . 我想在此数据集上训练线性SVM . 问题是我只有 8 Gigabyte of RAM! 所以我无法加载所有数据一次 . 有没有解决方案来训练这个大型数据集上的SVM?生成数据集是我自己的愿望,目前是HDF5格式 . 谢谢 -
6 votesanswersviews
R中的分段线性和非线性回归
我有一个问题,或许更多的是统计查询,而不是直接与r相关的问题,但是我可能只是错误地调用了r包,所以我将在这里发布问题 . 我有以下数据集: x<-c(1e-08, 1.1e-08, 1.2e-08, 1.3e-08, 1.4e-08, 1.6e-08, 1.7e-08, 1.9e-08, 2.1e-08, 2.3e-08, 2.6e-08, 2.8e-08, 3.1e-08, 3.5e-0... -
0 votesanswersviews
R:randomForest错误消息
尝试在具有400个样本的数据集上运行Random Forest,并在数据帧df中运行大约360个变量: 我正在尝试使用变量( s10 , s100 等等)来预测基因型 . 这是我正在使用的代码: rf <-randomForest(Genotype ~ ., data = df, importance = TRUE, proximity = TRUE) 但我一直收到错误信息: Error... -
1 votesanswersviews
使用列名中的for变量添加到R中的数据框
我在R中有一个for循环,我想在名为rand1,rand2,rand3等的数据框中创建10个不同的变量......这是我先尝试过的: for (rep in 1:10) { assign(paste('alldata200814$rand', rep, sep=""), runif(nrow(alldata200814), 0, 1)) } 但这不起作用 - 没有错误... -
69 votesanswersviews
R for循环跳转到下一次迭代ifelse
假设你有一个像这样的for循环 for(n in 1:5) { #if(n=3) # skip 3rd iteration and go to next iteration cat(n) } 如果满足某个条件,如何跳到下一次迭代? -
0 votesanswersviews
对于循环跳过错误
我想通过for循环获取谷歌趋势数据 . 然而,一个错误阻碍了我 . 在搜索其他堆栈问题后,我仍然无法使其工作 . 有问题的循环: a2p = for (i in dfurlnames$names1) { x<- paste(i) gtrends_function3(x) } 在我的for循环中,我收到以下错误: Error : res$status_code == 200... -
2 votesanswersviews
外部结构矩阵
我有一个问题,如何构建这种类型的矩阵,节省更多的时间 . 任务是用户输入自然数(n = 1,2,3,4,5 ......)并且R必须打印这种类型的矩阵(在n = 4的矩阵类型下面) . 我观察到第一列和第二列与第6和第7列对称,并且足以正确打印左侧的第一列和第二列 . 此外,我观察到第3列是作为第二列c(0,0,1,1,1,0,0)获得的,其对应于1 1 = 3 - 该列的数量 . 但是我不明白... -
3 votesanswersviews
在循环中略过偶然的错误
我知道"skip error in for loop"已被多次回答(参见How to skip an error in a loop或Skip Error and Continue Function in R) . 但是所有答案都很复杂,很难适用于新手的不同情况 . 我正在使用一段代码对100个数据集进行高斯直方图拟合 . results = list() for(i in 1... -
0 votesanswersviews
使用for循环在多个数据帧上基于ID过滤行
如何根据R中名为“Camera”的另一个df中的匹配ID,从我的全局目录中过滤180个.csv文件?当我试图将我的逐个文件过滤代码(参见步骤3b)合并到for循环中时(参见步骤3a),我得到错误: 粘贴错误(“i”)$ SegmentID:$运算符对原子向量无效 . 我对循环函数很新,所以我非常感谢你的帮助!所有180个文件都有一个唯一的名称,长度不同,但具有相同的列结构和名称 . 他们看着像... -
1 votesanswersviews
使用data.table计算lapply中的新列
如果这是双重发布,请提前道歉,但我没有找到解决方案,我正在努力在这里工作(和学习) . 我正在尝试将我的代码更改为data.table方法而不是data.frame,因为速度优势因为我正在处理数百个具有每百万个值的测量文件 . 我无法弄清楚如何编写以下场景的代码:我的列的名称由2部分组成:通道和参数如:FWS.Maximum,FWS.Minimum 因为代码必须用于具有不同通道的仪器数据,所以我写... -
0 votesanswersviews
在R上编程循环
为了解释我试图回溯可能的配对交易策略 . 因此我先测试了所有可能的对组合以进行协整,然后将它们存储在名为combos的变量中,这是一个2x869矩阵,在每列中包含两个协整的资产的id,所以如果我取这个变量的第一列我get(1,25)表示我的数据中的资产编号1和编号25是协整的 . 第二个变量是datats,它是一个xts对象,它包含我在不同日期的73个资产的价格 . 现在我正在尝试对它们运行一个循... -
7 votesanswersviews
在R中的每个外部循环迭代中打印j
对于以下代码:我无法弄清楚为什么 j 不会在每个外部循环迭代中打印 . x = 0 for (j in 1:15) { for (i in 1:100000) { x = x + 1 } print(j) } R似乎正在做的是运行整个事情,并最终打印出所有 j ,而不是逐个打开每个循环迭代 . 似乎应该在每次循环迭代后打印 j ,我在这里缺少什么? 有没有办法让它在每个外部循环迭代中打印 j ... -
0 votesanswersviews
在循环geom_hline中注释ggplots是错误的
我正在尝试打印带有多个图的pdf . 我正在使用循环和ggplot,这也是一个函数内部 . 我在对“情节”进行“注释”时遇到了麻烦 . 我想注释该条件的中位数和整体中位数 . 我使用水平线(geom_hline)和注释('text')来标记这些线 . 问题是单词正确放置(即注释(“text”,x = 1,y = Cmedian)似乎正常工作,但水平线正在错误的位置绘制(即.geom_hline(a... -
-1 votesanswersviews
在for循环中ggplot的奇怪问题
我试图在for循环中用ggplot绘制几个图形(名为p1,p2,p3,p4,p5,p6): for(i in 1:6){ assign(paste0("p",i), ggplot(TS, aes(Timestamp,TS[,i+1])) + geom_line() + scale_x_datetime(breaks = date_breaks("5 day"... -
8 votesanswersviews
在ggplot找不到的函数内创建的对象
我为我生成ggplots的许多站点提供了一系列时间序列数据,显示了使用changepoint包的方法的变化 . 我编写了一个函数,它接受csv,执行一些计算以获得方法然后遍历站点,为每个站点生成一个图 . 我的问题是找不到在for循环中创建的对象 . 下面是一个非常简单的示例,但会产生相同的错误: df1 <- data.frame(date = seq(as.Date("2015... -
0 votesanswersviews
一个或多个循环 - 多个ggplot图r
最后几天我确实问了一些关于循环的问题,这对我帮助很大,非常感谢你们!我想,这次我遇到了更复杂的问题 . 我跳过了标签代码中的标签和一些细节,但它完美无缺 . 一般来说,我想用循环产生大量的情节 . 我学会了如何处理像this这样的简单情节,但是对于ggplot和aes,我发现它更复杂 . Here are the data as dropbox上的.csv . 一些准备: data <- s... -
25 votesanswersviews
使用lapply在数据帧列表上应用函数并将输出保存到具有不同名称的文件
我有一个数据框列表,并给列表中的每个元素(例如每个数据框)一个名称: 例如 df1 <- data.frame(x = c(1:5), y = c(11:15)) df2 <- data.frame(x = c(1:5), y = c(11:15)) mylist <- list(A = df1, B = df2) 我有一个函数,我想应用于每个数据框;在这个函数中,我想... -
0 votesanswersviews
将函数写入大型列表中的Lapply
基本上我有几天的大型时间序列数据帧 . 我编写了一些代码,这些代码在数据框中一次可以运行一天,但现在我想调整它以便它可以运行一整天 . 对于我的数据框中的每一天,都有一个列包含当天的日出时间和一个包含日落的列 . 我想利用这些时间将每一天分成白天和夜晚 . 我的日出日落列看起来如此,每天都不同: Sunrise Sunset 2010-01-19 08:55:12 201... -
2 votesanswersviews
R:将数据表拆分为多个块并在每个块上应用函数
我正在尝试将大型csv文件作为数据表读取,根据字段“sample_name”将其拆分为64个块,并以并行方式在每个块上应用函数“myfunction” . library(data.table) library(plyr) library(doMC) registerDoMC(5) #assign 5 cores #read large csv file with 6485845 rows, ... -
-1 votesanswersviews
如何添加两个lapply函数的输出文件
我曾两次使用一个lapply函数来分析所有学生的数据以及全班的1-3所学校的失败学生 . 使用拆分功能,已根据学校名称拆分了两个数据帧 . 现在,我需要在一个文件中看到一所学校(学校)名单中的学生和失败学生 . 这是我的代码: spt1 <-split(pass, pass$school) # ^ result1 is a dataframe, splitting school wise ... -
1 votesanswersviews
R:将计算列添加到数据帧列表中
我有两个数据框列表 . 我想在第一个列表上进行一些计算,然后将结果应用到第二个列表 # first list df1 <- data.frame(id=1:5, score=c(rep(1, 3), rep(0, 2))) df2 <- data.frame(id=1:5, score=c(rep(1, 4), rep(0, 1))) df1 id score 1 1 ... -
0 votesanswersviews
使用lapply将函数应用于读入文件列表并将输出保存为新的文件列表
我是R的新手,有点卡在我觉得可能是常见的操作上 . 我需要执行基本功能的文件有多个(57个,累计行数为6亿~15亿行) . 我能够读取这些文件并执行我不需要的计算但是我在最终输出中绊倒了 . 我设想一次处理1个文件的函数,输出工作文件并移动到下一个文件 . 在计算之后,我想输出57个新的.txt文件,这些文件以输入数据首先来自的文件命名 . 到目前为止,我能够在较小的测试数据集上执行计算并吐出1个... -
0 votesanswersviews
用列表中的字符填充NA
我有一些数据如下: library(tidyr) library(data.table) thisdata <- data.frame(numbers = c(1,3,4,5,6,1,2,4,5,6) ,letters = c('A','A','A','A','A','B','B','B','B','B')) otherdata <- d... -
0 votesanswersviews
如何将PAD功能(来自PADR()包)用于多个数据帧?
我有24个文件(当天每小时1个,HR_NBR =小时数),我要填写每个文件中的日期 . AS-IS数据: CLNDR_DT HR_NBR QTY 01/07/2016 1 6 03/07/2016 1 10 TO-BE数据: CLNDR_DT HR_NBR QTY 01/07/2016 1 6 02/07/2016 NA NA 03/07/2016 1 ... -
3 votesanswersviews
使用pander酿造报告时如何删除行名?
我正试着用R来生成报告,并且认为我已经决定只使用 pander ,在使用 knitr , Rmarkdown , pander 和 reports 的各种组合后感到困惑 . 我现在有两个文件: 'ReportIntro.brew'包含报告的结构 # My Report Title ## Sample Information #### <%=set.alignment('left') ; a... -
5 votesanswersviews
Pander Knitr问题:使用pander.list时出错
另一个与pander(knitr)可重现的错误:当我尝试平移列表时,我无法创建PDF文件 - 它似乎发生在表或data.frame放入列表中时 . 如果列表中只有向量,则PDF编译但看起来很难看 . 我在Windows上使用pander 0.5.1,knitr 1.7,R version 3.1.1,Miktex RStudio . Doesn't work: ```{r, eval=FALSE}... -
5 votesanswersviews
R,knitr,pander - 如何很好地格式化日期摘要()
我正在使用 summary() 在 knitr 文档中生成日期变量的简单摘要,并希望将结果格式化得很好 . summary(some_date) 产生我想要的结果(值显示为日期),但格式不是很好 . 所以,我尝试过: pander::pander(summary(some_date)) 这会生成格式良好的结果,但值显示为整数而不是日期 . (对于Date,POSIXct和POSIXlt日期,... -
0 votesanswersviews
R:Pander无法从回归输出中正确编号汇总表
我正在使用pander打印回归输出 . 但是,它会自动(错误地)标记表格 . 我曾尝试使用 setcaption 来覆盖这种习惯,但它只是将 Headers 放在自动表号的右侧 . 有什么想法吗? -
2 votesanswersviews
使用有效星和pandoc时,Pander奇怪地格式化表格
如果我运行带有显着星的线性回归,通过pander渲染它,并且"Knit PDF"如下: pander(lm(crimerate ~ conscripted + birthyr + indigenous + naturalized, data = data), add.significance.stars = T) 我偶尔会得到输出,其中输出表中的行之间存在奇怪的间距问题 . ... -
5 votesanswersviews
调用rmarkdown :: render时,接收器已满
我正在关注this short tutorial直接将我的R脚本打印为HTML文档 . 它应该非常简单 . 通过对其他正常R脚本的 Headers 和注释进行一些小的更改,在R脚本末尾调用命令 rmarkdown::render('/Users/you/Documents/yourscript.R') 应该调用 knitr::spin 函数从我的R脚本转到Rmd文件到最终的HTML或PDF . 我...