首页 文章
  • 0 votes
     answers
     views

    用于将MS Office文件格式(doc,docx,ppt等)转换为纯文本的Web服务?

    更大的背景:我们需要能够在所有办公室类型中搜索:doc,docx,xls,xlsx,ppt和pptx . 在搜索算法已经到位的情况下,我们使用Office自动化实现了索引器;但是,客户关心的是,这是1,容易出错,2,不是微软推荐的(并且也未在其许可证中涵盖) . 我已经在SO上阅读了这方面的先前答案,但是它需要我们集成大量不同的库来覆盖所有边缘,我们没有资源这样做 . 因此,我们正在寻找一个简单的...
  • 1 votes
     answers
     views

    哪个更容易? iText或邮件合并

    我正在为一个学校筹款活动开展项目,我应该能够将结果输出到PDF或Word Doc,我可以很容易地自动打印出具有相同页面内容但结果不同的工作表 . 我希望我能够使页面看起来很有趣,有鲜艳的色彩和图像 . 我一直在环顾四周,这两件事引起了我的注意,你建议我用它? iText或邮件与Office合并? (如果你推荐一个,你还可以为我添加资源吗?) 谢谢!
  • 2 votes
     answers
     views

    用于WordML到Word2002转换的Java lib

    对于我正在处理的项目,我需要将WordML流转换为Word 2002兼容的.doc格式(不要问为什么 - 但是相当大的一组用户仍然在Word 2002上升级到最新版本,直到2010年第四季度才可行) . 我试图研究很多选择,并且大多数都走到了尽头 . 我的用例是存在一个现有的基于Java的Web服务(在Tomcat下的Solaris上运行),该服务根据用户的请求调用第三方服务 . 此3rdPart...
  • 4 votes
     answers
     views

    如何在Objective-C中为iOS创建和保存.rtf,.doc,.docx

    我希望在iPad(iOS)上创建并保存rtf,doc或docx文件 . 场景是我们希望帮助用户在iPad上创建内容,然后让他们通过电子邮件将其作为跨平台的可编辑文档(OS X,WIN)发送 . 除了rtf,doc或docx文件格式之外,我对其他解决方案持开放态度 . 谢谢, 詹姆士
  • 2 votes
     answers
     views

    来自Java的邮件合并

    有没有人有过在word文档上用Java进行邮件合并的经验?我需要支持doc和docx格式 . 我听说过Apache POI和docx4j . 但是,从阅读中我可以肯定POI中的支持这个词有多好 . docx4j只支持docx格式 . 可以建议上述任何一个(并纠正我的支持知识)或其他适当的库 . 如果有必要,我愿意使用一个lib作为doc,另一个作为docx . 谢谢 .
  • 0 votes
     answers
     views

    在java中将.doc转换为.pdf(免费)

    我创建了一个java应用程序,在输出中创建一些文档 . 这些文档是使用apache POI api创建的,由文本abn表组成 . 我的老板现在决定他们也希望用pdf格式存储它们 . 他们当然有0美元的预算 . 我尝试使用iText 4.2(来自lgpl许可证),但我丢失了所有表格(我只有裸文本) 这是我的脚本: try{ XWPFDocument doc = n...
  • 11 votes
     answers
     views

    将Word doc或docx文件转换为文本文件?

    我需要一种方法将 .doc 或 .docx 扩展名转换为 .txt ,而无需安装任何内容 . 我也没有't want to have to manually open Word to do this obviously. As long as it'在auto上运行 . 我在想Perl或VBA可以做到这一点,但我也无法在网上找到任何东西 . 有什么建议?
  • 46 votes
     answers
     views

    如何从.doc和.docx文件中提取纯文本? (unix)[关闭]

    任何人都知道他们可以推荐什么,以便从.doc或.docx中提取纯文本? 我发现这个Best way to extract text from a Word doc without using COM/automation? - 想知道是否还有其他建议? 速度并不重要,我们甚至可以使用具有一些API的网站上传和提取文件,但我一直无法找到 . 谢谢
  • 7 votes
     answers
     views

    使用Java将DOC文件转换为DOCX

    我需要在我正在开发的Java软件中使用DOCX文件(实际上是其中包含的XML),但我公司的一些人仍然使用DOC格式 . 您知道是否有办法使用Java将DOC文件转换为DOCX格式?我知道使用C#是可能的,但这不是一个选择 我用Google搜索了,但没有出现...... 谢谢
  • 0 votes
     answers
     views

    PDF,PPT,DOC等文字

    也许这些应该是单独的问题,每个格式一个,但...... 什么是最可靠 libraries (任何语言), binaries (对于任何平台),或 webservices (免费或不免费) converting 多样"text-containing"格式为 plain text ? 通过可靠,我的意思是接近100%提取所有 human-readable text 而不提取&quo...
  • 48 votes
     answers
     views

    如何将doc / docx文件转换为markdown或结构化文本?

    是否有将 .doc 或 .docx 文件转换为Markdown或类似文本的程序或工作流程? PS:理想情况下,我欢迎将MS Word文档中的特定字体(例如 consolas )呈现给 `text-code: ```....```` 的选项 .
  • 2 votes
     answers
     views

    使用DocX dll将行添加到word文件(doc文件)中的现有表

    我有一个问题,在我的应用程序即时操作word文件中添加行到我现有的表 . 在我的模板(word文件)中,已经有一个包含8行的表,不包括 Headers (你可以在图片中看到),在我的应用程序中构建一个新的word文件时,有时我想在表中添加更多行,因为我有更多数据要插入(来自dataGridView的数据) . 就像在下面的代码中一样,我根据我的datagridview中的行数添加行,问这个: us...
  • 0 votes
     answers
     views

    VBA:Word将.docx文件保存为.doc文件,如何保存为docx?

    在Excel中,我有一些完美的宏 . 我对这些宏所做的是打开Word文档(.docx),用Excel文件中的数据填充书签,将单独的Word文档与文件名中的一些数据一起保存在指定的文件夹中 . 没什么大不了的(再也没有) . 问题是输入文件是.docx文件 . 输出文件是.doc(Word 97-2003兼容) . 如何将输出文件保存为.docx文件?我的VBA中负责保存的部分是这样的: wordA...
  • 19 votes
     answers
     views

    学习Linux x86-64汇编和文档的建议[关闭]

    有没有人有关于学习Linux x86-64程序集基础知识的文档?我不确定是否要按原样学习它,或者先学习x86,然后再学习它,但是因为我有一台x86-64计算机而不是x86,我正在考虑学习x86-64; ) 也许有人可以给我一些激励,并指导学习什么,如何以及用什么文档 . 请给我你最喜欢的文档 Headers ,我编写一些Python,这是我第一次尝试低级语言,而且我已经准备好专注于它 . 谢谢大家...
  • 4 votes
     answers
     views

    上传PDF或.doc和安全性

    我有一个脚本允许用户将文本文件(PDF或doc)上传到服务器,然后计划将它们转换为原始文本 . 但是直到文件被转换,它才是原始格式,这让我担心病毒和各种令人讨厌的东西 . 任何想法我需要做什么来最小化这些未知文件的风险 . 如何检查它是否干净,或者它是否是它声称的格式,并且它不会使服务器崩溃 .
  • 0 votes
     answers
     views

    使用Apache POI和Apache PDFBox阅读doc,pdf文件时错误定位的文本框

    我试图通过使用 Apache POI (对于doc,docx)和 Apache PDFBox (对于pdf)库将它们转换为单个字符串来阅读和处理Java中的.doc,.docx,.pdf文件 .它工作正常,直到遇到文本框 . 如果格式是这样的: paragraph 1 textbox 1 paragraph 2 textbox 2 paragraph 3 那么输出应该是:paragraph 1 t...

热门问题