我无法在Python 3.x中打印PDF版本为1.4或更低的pdf文件的内容 . 该代码适用于PDF版本1.5及更高版本的pdf文件 . 代码如下:
导入所需的模块
导入PyPDF2
创建pdf文件对象
pdfFileObj = open('C:/Users/ravi/Documents/pdf-sample.pdf','rb')
创建pdf阅读器对象
pdfReader = PyPDF2.PdfFileReader(pdfFileObj)
打印pdf文件中的页数
打印(pdfReader.numPages)
创建页面对象
pageObj = pdfReader.getPage(0)
从页面中提取文本
打印(pageObj.extractText())
关闭pdf文件对象
pdfFileObj.close()