首页 文章

从pdf文件中提取特定数据

提问于
浏览
-1

有人可以提供一些解决方案,想法或只是一个关于如何从pdf文件中提取某些特定数据的指示,我使用pdfbox和PDfTextStripper来提取pdf文件中的所有文本,它正常工作我可以提取所有文本,单词通过单词和逐行但我无法提取一些单词(特定字符串:例如价格,年龄)我想要提取一些我想从pdf文件中提取的所需数据 .

1 回答

  • 0

    你可以使用 pdfgrep 它就像 grep ,但它不是文本文件,它可以挖掘低谷并找到与pdf中给定正则表达式匹配的东西 . 希望这可以帮助

相关问题