首页 文章

如何编辑可搜索PDF的搜索文本?

提问于
浏览
0

我可以访问我的图书馆的扫描仪,它可以创建“可搜索的PDF” . 这些是显示扫描文档的确切图像的PDF,但是当您尝试选择包含文本的图像的一部分时,PDF中可以选择一种隐藏文本 . 通过这种方式,您可以复制和粘贴文本或在扫描的文档中搜索文本 . 这非常有用 . 这是对原始扫描图像的一个很棒的改进 . 我的Mac上还有几个应用程序,可以从扫描的文档或原始图像创建这种可搜索的PDF .

现在很明显,任何使用过OCR的人都认为将图像转换为文本的过程不是100%准确,因此在某些地方搜索或复制的文本不正确 .

因此,我搜索了一段时间来找到一个可加载可搜索PDF的应用程序,并允许我修复隐藏的可搜索文本,而无需重新格式化或修改原始扫描图像 .

有没有人知道允许这个的工具(或库API)?

它似乎甚至允许我查看隐藏的可搜索文本,更不用说编辑它了 . 它允许我用自己的OCR过程的结果替换扫描图像,以便我可以编辑和保存文档 . 但是这会对我正在使用的任何扫描文档产生可怕的结果 . 它似乎是为编辑"native PDF"而不是编辑扫描文档而设计的 .

我也试过没有运气的ABBYY FineReader .

1 回答

  • 0

    我正在使用ABBYY FineReader 12 Professional . (不是开源)只需打开扫描图像或扫描pdf并按验证文本(或 Ctrl + F7 ),然后再检查所有拼写错误或低可信度的字符并修复它们 .

    该程序非常好,为了方便起见,它向您显示image / pdf中的确切位置以及OCR猜测 . 它迭代所有这些 .

    [顺便说一下,我正在使用快捷方式来加快速度: Alt+Enter 将无法识别的单词添加到字典中 . Ctrl+Delete 如果您修理了它,请跳过单词或确认 . ]

    将文档另存为pdf文件菜单:文件>将文档另存为> PDF文件,您可以在每个pdf阅读器上搜索它 . 保存的文件与扫描的文件看起来相同,但文本后面有“文件” .

    很奇怪你尝试过没有运气的ABBYY ......它对我很有用 . 也许你没试过专业版 .

    希望它能帮到你 .

相关问题