我正在寻找一组.NET组件(或转换解决方案),允许将源文档转换为一系列光栅图像(多页TIFF将是最好的) . 此外,他们必须支持使用嵌入式文档(如Word文档中包含的文档),至少允许检索嵌入的文档以进行进一步处理 .
应支持的文件格式:
-
DOC和DOCX
-
RTF
-
XLS和XLSX
-
PPT和PPTX
-
ODT
-
消耗臭氧层物质
-
ODP
很高兴有:
-
PDF
-
PDF / A.
-
HTML(最好是非基于IE的渲染 - 它将在服务器系统中使用)
-
MSG(dtto)
我一直在研究Aspose的组件,它们似乎有着良好的声誉,但它们不支持OpenOffice格式 .
我对供应商有很强的要求:
-
没有一个人的商店或未来不确定的开源项目
-
应该是商业产品
-
必须提供商业优先支持
-
必须具有兼容性保证,以便将来的格式更新作为维护订阅的一部分
许可模式并不重要,不需要免版税 . 预期用途是针对单个自定义开发项目 .
1 回答
不知道任何开箱即用的解决方案,但一种方法可能是将文档打印到postscript文件并使用Ghostscript将它们转换为TIFF . 我很确定这可以通过编程方式完成您列出的大多数程序(您可能需要为MS Office和Open Office提供不同的解决方案) . 例如,这是我们在MS Powerpoint中使用的VBA片段,使用Ghostscript打印机驱动程序将单页打印到postscript文件:
(通过.NET使用MS Office应用程序的COM接口看起来与这个VBA例程非常相似 . )我不习惯OpenOffice API,但我认为不应该太难以找到它在类似物中是如何工作的办法 .