我正在做一个关于算法和数据结构的课程,对于我的作业,我建议在提交之前做很多统计测试 . 我的测试主要是执行时间,生成输出的随机性等 . 我正在查看R表示我的数据的图形表示 .
我想知道哪些文件R更喜欢从中读取数据,哪些文件可以在java中轻松创建 .
我看到很多人向R提供csv文件,为此我需要类似java中的openCSV库 . 另外,与csv-s相比,出于同样目的,分隔分隔的.txt文件有多好/多差?
edit: 好吧,当我说更喜欢我真的没有't personify R or anything... just i thought it'是表达我的感受的最佳方式 . 我在2007年邮局的R 's page that excel sheets arent a good choice , especially the one'中找到了一个地方 . 这与生活真的如此简单的想法相结合? ,我找到了我正在寻找的一个软件,她接受我的简单的分页文本文件,并给我回到我想要的一切?看起来好得令人难以置信 .
我感谢大家的答案,R对于数据导入文件类型似乎是公正的 .
2 回答
这里的答案是R并不真正“喜欢”任何东西 . 它非常适合处理多种数据格式 .
CSV文件:
read.csv
或read.csv2
,具体取决于您的CSV文件所包含的分隔符 .分隔文件:
read.delim
或read.delim2
取决于您具有的小数分隔符 . 这里的选项卡是默认选项,但原则上可以是任何选项 . 即使是,或;固定宽度格式文件:
read.fwf
也使用tab作为默认分隔符 .这应该给你一些想法 .
如果您有非常大的数据集,我建议使用SQL变体 . 有了它,你可以很容易地选择子集 . 当然,您必须首先将其转换为数据库格式,通过执行以下操作可以实现:
(请参阅http://code.dedu.ch/2011/07/csv-file-direkt-in-mysql-importieren/,不幸的是德语教程,但那里提供的代码应该足够了 . )
编辑:忘记包含SQL包链接:http://cran.r-project.org/web/packages/RMySQL/index.html
在所有其他情况下,R不喜欢任何数据 . 您只需要像其他人建议的那样正确配置阅读过程 .