-
2 votesanswersviews
可以配置Sphinx --->获得与MySQL全文搜索相同的结果
我有一个MySQL数据库表,其中包含多个记录: "word-A" -- "words related to word-A" 例如:椅子 - 家具; table ;办公椅;餐椅 我目前正在使用MySQL全文匹配查询(普通匹配,而不是布尔模式)来匹配这些单词的句子 . 我将结果限制为5.我正在使用全文索引,我也在缓存中加载这些索引 . 此查询为我提供了高质量的... -
5 votesanswersviews
思考Sphinx和acts_as_taggable_on插件
我在轨道2.3.2上安装了Sphinx和Thinking Sphinx for ruby . 当我无条件搜索时,搜索工作正常 . 现在,我想做的是按标签过滤,因此,当我使用acts_as_taggable_on插件时,我的公告模型如下所示: class Announcement < ActiveRecord::Base acts_as_taggable_on :tags,:catego... -
1 votesanswersviews
Sphinx / Solr / Lucene / Elastic Relevancy
我们拥有一个包含3000万个产品的超大型数据库,需要查询它们以创建搜索结果,并且广告每秒显示数千次 . 我们一直在研究Sphinx,Solr,Lucene和Elastic作为执行这些持续大规模搜索的选项 . 这是我们需要做的 . 获取关键字并在数据库中运行它们以查找与最接近的产品匹配的产品 . 我们将使用我们的OWN算法来确定哪些产品与我们的广告目标最相关,但我们知道这些引擎已经拥有自己的相关性算... -
8 votesanswersviews
在Lucene / Solr,飞快移动,狮身人面像,Xapian中最好地融合了蟒蛇? [关闭]
我是初创公司的新手编码器,我正在网络主机的目录中实现文档搜索 . 我正在比较Lucene / Solr,飞快移动,狮身人面像和Xapian . 飞快移动本身就是蟒蛇 . 但我也想要你的意见 . 其中有哪些 成熟且易于使用并使用python安装接口? (嗖的一声) 没有机会发生崩溃,瓶颈和其他故障 最好的文档界面(我不读PHP文档,因为python文档很稀疏) 最容易启动和运行(只有... -
1 votesanswersviews
文件搜索Lucene / Solr,飞快移动,狮身人面像,Xapian
我正在比较Lucene / Solr,Whoosh,Sphinx和Xapian搜索DOC,DOCX,HTML和PDF文档 . 只有Solr被记录为具有直接索引文档的文档解析器(Tika) . 所以它似乎是一个明显的赢家 . 但为了 balancer 竞争环境,我想考虑其他选择 . 其他人有 direct document indexing (我可能错过了)?如果不是,它们是否可以轻松实施?索尔是压... -
0 votesanswersviews
是狮身人面像还是lucene适合我? (突出搜索和同义词搜索)
我对这些搜索引擎做了快速研究,但我还没找到我想要的东西 . 我感兴趣的是实现一个 search for synonyms (目前我是使用mysql的简单全文搜索随机实现的),但最重要的是我要计算,而不是密钥的密度, prominence of keywords : 也就是说,mysql索引的 "as soon as they, the keywords, appear" in ... -
398 votesanswersviews
ElasticSearch,Sphinx,Lucene,Solr,Xapian . 哪种适合哪种用途? [关闭]
我目前正在寻找其他搜索方法,而不是有一个巨大的SQL查询 . 我最近看到elasticsearch并使用了whoosh(搜索引擎的Python实现) . 你能说出你选择的理由吗? -
301 votesanswersviews
全文搜索引擎的比较 - Lucene,Sphinx,Postgresql,MySQL?
我正在 Build 一个Django网站,我正在寻找一个搜索引擎 . 一些候选人: Lucene / Lucene与Compass / Solr 狮身人面像 Postgresql内置全文搜索 MySQl内置全文搜索 选择标准: 结果相关性和排名 搜索和索引速度 易于使用,易于与Django集成 资源要求 - 网站将托管在VPS上,所以理想情况下搜索引擎不需要大量... -
4 votesanswersviews
solr还是sphinx?哪个更好? [重复]
可能重复:选择独立的全文搜索服务器:Sphinx还是SOLR? 我将使用它在我的ruby on rails app上进行全文搜索 . 这是最好的选择 . solr用java来做这个工作 . 或红宝石中的sphix? -
45 votesanswersviews
如何评估托管全文搜索解决方案?
SaaS /托管全文搜索有哪些选择?我该如何评估可用的不同选项? 我正在寻找在后端使用Lucene,solr或sphinx的东西,并提供REST API用于将文档提交到索引和运行搜索 . 我可以构建自己的EC2 AMI,但我必须配置EBS和其他东西,监控它等 . -
3 votesanswersviews
选择具有自定义排名功能的独立搜索服务器,spartial search
我正在研究为我参与的项目选择搜索服务器的不同选项 . 搜索服务器用于在Rails中构建的约会网站上提供结果,其中搜索提供所有'匹配' - 魔术 . 典型的查询将涉及使用表达式(伪代码)对文档/结果进行排名: 按排名排序: 50如果has_image属性为true 10如果has_boost属性为true 50如果纬度/经度距离[点] 40英里以内 20如果纬度/经度在80英里以... -
3 votesanswersviews
具有多个索引和复杂要求的全文搜索
我们正在构建一个应用程序,要求我们为每个用户编制索引数据,以便我们可以对其数据进行全文搜索 . 以下是有关应用程序的一些值得注意的事项: A)每个用户的数据与其他每个用户完全无关 . 这给我们带来了一些好处: 我们可以保持索引的小小 . 合并/合并碎片索引将花费更少的时间 . 如果某些索引由于某种原因(腐败?)而无法访问,则只有那些用户受到影响 . 其他用户不受影响,并且可以为他们提供... -
192 votesanswersviews
选择一个独立的全文搜索服务器:Sphinx还是SOLR? [关闭]
我正在寻找具有以下属性的独立全文搜索服务器: 必须作为独立服务器运行,可以为多个客户端提供搜索请求 必须能够通过索引SQL查询的结果来执行"bulk indexing":比如"SELECT id, text_to_index FROM documents;" 必须是免费软件,必须在使用MySQL作为数据库的Linux上运行 必须快(排除MyS... -
0 votesanswersviews
关于如何索引单词并使用其类型(实体等)进行注释的指导,然后是Elasticsearch / w.e . 用注释返回这些单词?
我正在尝试 Build 一个非常简单的NLP聊天(我甚至可以说伪NLP?),我想识别一个固定的意图子集(动词,情绪)和实体(产品等) 它's a kind of entity identification or named-entity recognition, but I'我不确定我需要一个完全成熟的NER解决方案来实现我想要的目标 . I don't care if the person ...