我可以从未被下一个命令锁定的网站上完美下载PDF:
require(XML)
url <- ('http://www.eluniversal.com.mx/impreso/wportada_20121202.pdf')
download.file(url, 'universal.pdf')
但对于需要密码的网站我不能 . 在我下载它并且我试图打开它之后,说该文件可能已损坏 . 这是链接示例:
require(XML)
url <- ('http://www.reforma.com/edicionimpresa/paginas/20121201/pdfs/rPRI20121201-001.pdf')
download.file(url, 'reforma.pdf')
1 回答
如果您有密码进入该站点,您可以尝试在启动R之前使用Internet Explorer登录它; R需要cookie才能访问安全网站 .