我正在从给定的PDF文档开始关键字提取 . 我使用PyPDF2读取PDF文档,然后使用pdfReaderObject从文档中提取文本 . 但是,如果我使用PyPDF2和RAKE,那么它会逐页显示关键字(这会导致问题,因为在其他页面中会重复单词) . 所以我所做的是阅读整个PDF文档并将其文本保存到另一个文件'abc.txt'中,然后将此文件与RAKE一起用于关键字提取 . 但是,由于这需要我为每个其他PDF文档创建一个新的.txt文件,我想知道是否有任何方法可以使用PyPDF2本身而不需要创建另一个.txt文件?我正在使用Python .