首页 文章

R应该从哪个文件类型导入数据? [关闭]

提问于
浏览
0

我正在做一个关于算法和数据结构的课程,对于我的作业,我建议在提交之前做很多统计测试 . 我的测试主要是执行时间,生成输出的随机性等 . 我正在查看R表示我的数据的图形表示 .

我想知道哪些文件R更喜欢从中读取数据,哪些文件可以在java中轻松创建 .

我看到很多人向R提供csv文件,为此我需要类似java中的openCSV库 . 另外,与csv-s相比,出于同样目的,分隔分隔的.txt文件有多好/多差?

edit: 好吧,当我说更喜欢我真的没有't personify R or anything... just i thought it'是表达我的感受的最佳方式 . 我在2007年邮局的R 's page that excel sheets arent a good choice , especially the one'中找到了一个地方 . 这与生活真的如此简单的想法相结合? ,我找到了我正在寻找的一个软件,她接受我的简单的分页文本文件,并给我回到我想要的一切?看起来好得令人难以置信 .

我感谢大家的答案,R对于数据导入文件类型似乎是公正的 .

2 回答

  • -1

    这里的答案是R并不真正“喜欢”任何东西 . 它非常适合处理多种数据格式 .

    • CSV文件: read.csvread.csv2 ,具体取决于您的CSV文件所包含的分隔符 .

    • 分隔文件: read.delimread.delim2 取决于您具有的小数分隔符 . 这里的选项卡是默认选项,但原则上可以是任何选项 . 即使是,或;

    • 固定宽度格式文件: read.fwf 也使用tab作为默认分隔符 .

    这应该给你一些想法 .

  • 1

    如果您有非常大的数据集,我建议使用SQL变体 . 有了它,你可以很容易地选择子集 . 当然,您必须首先将其转换为数据库格式,通过执行以下操作可以实现:

    LOAD DATA LOCAL INFILE 'csvTest.csv'
    INTO TABLE csvImport
    FIELDS TERMINATED BY ';'
    ENCLOSED BY '"'
    LINES TERMINATED BY '\n'
    IGNORE 1 LINES
    

    (请参阅http://code.dedu.ch/2011/07/csv-file-direkt-in-mysql-importieren/,不幸的是德语教程,但那里提供的代码应该足够了 . )

    编辑:忘记包含SQL包链接:http://cran.r-project.org/web/packages/RMySQL/index.html

    在所有其他情况下,R不喜欢任何数据 . 您只需要像其他人建议的那样正确配置阅读过程 .

相关问题