首页 文章
  • 1 votes
     answers
     views

    当解析的PDF被破坏时,我可以优雅地使PyPDF2失败吗?

    我有一个Python应用程序从公共网站上抓取数百个PDF文件并使用这个python库解析它们PyPDF2 在成功解析的数百个此类文件中,有一个文件让我心痛 . 这是18页长 . 文件名是'bad.pdf' . 你可以看到here . 这是我将解析文档的代码: $ virtualenv my_env $ source my_env/bin/activate (my_env) $ pip instal...
  • 0 votes
     answers
     views

    如何使用PyPDF2获得Pdf方向

    我正在使用Python / Django .PyPDF2读取我当前的pdf . 我想阅读我已保存的pdf并获取pdf中单页的方向 . 我希望能够确定页面是横向还是纵向 . tempoutpdffilelocation = settings.TEMPLATES_ROOT + nameOfFinalPdf pageOrientation = pageToEdit.mediaBox pdfOrient...
  • 4 votes
     answers
     views

    如何使用Python从PDF中的特定区域提取文本?

    我正在尝试使用Python从PDF中提取Text,并且我已经使用PyPDF2成功完成了这样的操作: import PyPDF2 pdfFileObj = open('path', 'rb') pdfReader = PyPDF2.PdfFileReader(pdfFileObj) pageObj = pdfReader.getPage(0) pageObj.extractText() 这将从页面...
  • 0 votes
     answers
     views

    使用Python和PyPDF2合并PDF文件会引发TypeError

    我正在使用 Python 3.6.5 将PDF合并在一起,但遇到了问题 . 下面的代码抛出 'TypeError: 'NumberObject' object is not subscriptable' 错误 . 我究竟做错了什么?当我用 merger.append 注释掉该行时,它会正确打印出文件路径 . import webbrowser import os from PyPDF2 impor...
  • 0 votes
     answers
     views

    如何使用PyPDF2和RAKE进行关键字提取?

    我正在从给定的PDF文档开始关键字提取 . 我使用PyPDF2读取PDF文档,然后使用pdfReaderObject从文档中提取文本 . 但是,如果我使用PyPDF2和RAKE,那么它会逐页显示关键字(这会导致问题,因为在其他页面中会重复单词) . 所以我所做的是阅读整个PDF文档并将其文本保存到另一个文件'abc.txt'中,然后将此文件与RAKE一起用于关键字提取 . 但是,由于这需要我为每个...
  • 0 votes
     answers
     views

    PyPDF2不打印pdf文件版本1.4及更低版本

    我无法在Python 3.x中打印PDF版本为1.4或更低的pdf文件的内容 . 该代码适用于PDF版本1.5及更高版本的pdf文件 . 代码如下: 导入所需的模块 导入PyPDF2 创建pdf文件对象 pdfFileObj = open('C:/Users/ravi/Documents/pdf-sample.pdf','rb') 创建pdf阅读器对象 pdfReader = PyPDF2.Pdf...
  • 0 votes
     answers
     views

    如何在Python中阅读多个PDF

    当我尝试在Python中的文件夹中读取和打印多个PDF的内容时,我一直收到此错误 . 我无法解决它 . 请帮我 . pdfFileObj = open(fp,'rb')IOError:[Errno 2]没有这样的文件或目录:'Mr praveen.pdf' 这是我的代码 import PyPDF2 import os path = r'/root/Desktop/temp_dir' #pa...
  • 0 votes
     answers
     views

    如何在python中将PyPDF.PageObject页面呈现为PIL图像?

    你能帮我把PyPDF2打开的pdf页面渲染成python3中的PIL图像吗?谢谢!!!

热门问题