如何使用PyPDF2和RAKE进行关键字提取？-Java 学习之路

我正在从给定的PDF文档开始关键字提取 . 我使用PyPDF2读取PDF文档，然后使用pdfReaderObject从文档中提取文本 . 但是，如果我使用PyPDF2和RAKE，那么它会逐页显示关键字（这会导致问题，因为在其他页面中会重复单词） . 所以我所做的是阅读整个PDF文档并将其文本保存到另一个文件'abc.txt'中，然后将此文件与RAKE一起用于关键字提取 . 但是，由于这需要我为每个其他PDF文档创建一个新的.txt文件，我想知道是否有任何方法可以使用PyPDF2本身而不需要创建另一个.txt文件？我正在使用Python .

如何使用PyPDF2和RAKE进行关键字提取？

相关问题