首页 文章

Scopus_ReadCSV {CITAN}不使用从Scopus导出的csv文件

提问于
浏览
0

我在Windows 7上使用Rstudio和R 3.3.1,我已经安装了 CITAN 包 . 我正在尝试从我从Scopus导出的CSV文件中导入参考书目条目(原样,未触动),选择导出所有可用信息 .

这是我得到的错误:

example <- Scopus_ReadCSV("scopus.csv")

Scopus_ReadCSV中的错误(“scopus.csv”):未找到列:“Source” . 另外:警告消息:1:在read.table中(file = file,header = header,sep = sep,quote = quote,:在输入连接'scopus.csv上找到无效输入'2:在read.table(file = file,header = header,sep = sep,quote = quote,:由'scopus.csv'上的readTableHeader找到的不完整的最终行

当我打开文件时,列'Source'就在那里,所以我不知道它为什么说“找不到” .

1 回答

  • 1

    最终我得出以下结论:

    • 从Scopus导出的CSV文件的编码是UTF-8-BOM,当使用Scopus_readCSV(“file.csv”)或read.table(“file.csv”,header =时)似乎无法从R识别TRUE,sep =“,”,fileEncoding =“UTF-8”) .

    • 虽然它是Scopus文件的编码类型,但是可以找到一些“奇怪的”非英文字符,这些字符在R中的读取函数中是不可读的 . (主要在具有特殊字符的名称中发现此问题)

    这些问题的解决方案:

    • 使用记事本等记事本应用程序打开CSV文件,并使用UTF-8编码保存文件,以便将R读取为UTF-8 .

    • 在R中运行读取功能时,您会注意到它停止读取(例如,在200个注册表中的第40个) . 看看它到底停在哪里,这样你可以通过用记事本打开CSV找到特殊字符,然后你可以根据需要删除/更改它,以便再次在R中没有相同的问题 .

相关问题