我使用iText读取包含XFA表单的PDF文档 . 我将其转换为XML,从XML读取数据并将其插入数据库 . 但是,如果我在PDF中没有XFA表格,那么我如何才能有效地从PDF中读取数据呢?
这取决于你的期望 .
您可以使用文本提取来检索特定页面上的所有文本 . 您如何处理文本取决于您 . (例如正则表达式)
您还可以选择使用pdf2Data,这是一个iText7附加组件,允许您将文档与模板进行匹配 . pdf2Data似乎很合适,因为它生成XML文件作为输出 .
有关pdf2Data的更多信息,请访问http://itextpdf.com/itext7/pdf2Data
1 回答
这取决于你的期望 .
您可以使用文本提取来检索特定页面上的所有文本 . 您如何处理文本取决于您 . (例如正则表达式)
您还可以选择使用pdf2Data,这是一个iText7附加组件,允许您将文档与模板进行匹配 . pdf2Data似乎很合适,因为它生成XML文件作为输出 .
有关pdf2Data的更多信息,请访问http://itextpdf.com/itext7/pdf2Data