-
39 votesanswersviews
使用插入符号完全可重复的并行模型
当我在插入符号中运行2个随机森林时,如果我设置一个随机种子,我会得到完全相同的结果: library(caret) library(doParallel) set.seed(42) myControl <- trainControl(method='cv', index=createFolds(iris$Species)) set.seed(42) model1 <- train(... -
2 votesanswersviews
在插入符号中设置种子平行随机森林以获得可重现的结果
我希望使用插入符号包并行运行随机森林,我希望设置种子以获得可重复的结果,如Fully reproducible parallel models using caret . 但是,我没有't understand line 9 in the following code taken from caret help: why do we sample 22 (plus the last model i... -
-5 votesanswersviews
什么是大规模打击编码问题的最佳网站(首选基于java)? [等候接听]
我正在寻找一个网站,我可以与其他人或大规模的编码相关的问题,并可以尝试解决不同的和一些典型的算法 . 我更喜欢基于Java的问题,但JavaScript,Python,C或C也可以 . -
0 votesanswersviews
在r中使用reprex包创建可重现的示例,其中正在读取本地文件
我经常使用 reprex::reprex 创建可重复的 R 代码示例,以获取其他人的帮助以消除代码中的错误 . 通常,我使用 iris 或 mtcars 等数据集创建最少的示例,并且效果很好 . 但是,每当我需要使用 own 数据时,我总是无法使用 reprex ,因为问题是如此具体,我不能依赖来自 datasets 库的数据集 . 在这种情况下,我收到以下错误: # loading needed... -
0 votesanswersviews
可重复的研究:通过使用GNU make调用statTransfer将sas7bdat数据文件转换为csv文件
问题: 我是GNU Make的新手 . 有没有更好的方法以编程方式将统计数据集从sas7bdat转换为csv文件并使用GNU Make使它们保持同步以促进可重复的研究?您是否会从编码角度以不同的方式处理此问题,还是有更好的方法来促进可重复的研究?我可以在使用静态模式规则时添加其他先决条件(即 statTransferOptions.txt )吗? 解决方案需要: 在所有子目录中查找所有sas7... -
0 votesanswersviews
将研究项目过渡到基于编织的设置
最后,考虑到我的情况,我决定让我的_590280更接近使它成为好的目标 reproducible research . 由于目前我没有使用 LaTeX 作为我的论文报告(虽然我正在考虑这个选项),我相信 knitr 是最好的方法 . 实施我的论文研究(数据分析)的实证部分的软件项目正在 R 中编写 . 该项目包含目录结构中的多个文件,这对于科学工作流程来说非常典型(顶级子目录: analysis... -
3 votesanswersviews
可重复研究的替代方法,其中源代码是主要媒介
TL; DR: 用于可重复研究的通用动态文档(IPython笔记本样式)方法通常不会产生可重用的源代码模块 . 是否有使用源代码作为主要媒介的工具/方法,并在其中包含文本以使代码更可重用? 常见动态文档方法的问题 我非常喜欢使用动态文档/笔记本进行可重复研究的概念 . 它特别适用于数据研究和分析,它可以方便地记录和评论分析过程 . 我通常使用Emacs Org-mode和/或IPython笔记本/...