有没有人知道.NET中的API / SDK或IFilter可以读取主题(“ Headers ”元数据)和以下文件中的文本:
.PDF .DOC .XLS .PPT .CSV .TXT .DOCX .XLS .PPTX OpenOffice和Open Document标准 .
开源将是很棒的......但商业也是可以的 .
我什么都找不到!
我认为您无法找到能够访问所有这些类型内容的单个IFilter . 通常,IFilter将用于特定技术 .
例如,Adobe have one for PDFs,Microsoft为Office提供了一个可以执行Word,Excel,Powerpoint,CSV(我认为可以预装Windows的) .
1 回答
我认为您无法找到能够访问所有这些类型内容的单个IFilter . 通常,IFilter将用于特定技术 .
例如,Adobe have one for PDFs,Microsoft为Office提供了一个可以执行Word,Excel,Powerpoint,CSV(我认为可以预装Windows的) .