首页 文章

文件搜索Lucene / Solr,飞快移动,狮身人面像,Xapian

提问于
浏览
1

我正在比较Lucene / Solr,Whoosh,Sphinx和Xapian搜索DOC,DOCX,HTML和PDF文档 . 只有Solr被记录为具有直接索引文档的文档解析器(Tika) . 所以它似乎是一个明显的赢家 .

但为了 balancer 竞争环境,我想考虑其他选择 . 其他人有 direct document indexing (我可能错过了)?如果不是,它们是否可以轻松实施?索尔是压倒性的选择吗?

1 回答

  • 0

    在Sphinx上,您可以使用PHP脚本通过xmlpipe_command选项转换文件 . 由于PHP有一个Tika包装器,编写脚本和设置本身并不难 .

相关问题