ElasticSearch默认评分机制-Java 学习之路

我正在寻找的是ElasticSearch（Lucene）的默认评分机制如何真正起作用的简单清晰的解释 . 我的意思是，它是否使用Lucene得分，或者它可能使用自己的得分？

例如，我想通过例如“名称”字段搜索文档 . 我使用.NET NEST客户端来编写查询 . 我们来考虑这种类型的查询：

IQueryResponse<SomeEntity> queryResult = client.Search<SomeEntity>(s =>
    s.From(0)
   .Size(300)
   .Explain()
   .Query(q => q.Match(a => a.OnField(q.Resolve(f => f.Name)).QueryString("ExampleName")))
);

这被转换为这样的JSON查询：

{
 "from": 0,
 "size": 300,
 "explain": true,
 "query": {
   "match": {
     "Name": {
       "query": "ExampleName"
      }
    }
  }
}

搜索执行的文档大约有110万个 . 我得到的回报是（这只是结果的一部分，我自己格式化）：

650   "ExampleName" 7,313398

651   "ExampleName" 7,313398

652   "ExampleName" 7,313398

653   "ExampleName" 7,239194

654   "ExampleName" 7,239194

860   "ExampleName of Something" 4,5708737

其中第一个字段只是一个Id，第二个是ElasticSearch执行搜索的名称字段，第三个是得分 .

如您所见，ES索引中有许多重复项 . 由于一些已发现的文档具有不同的分数，尽管它们完全相同（只有不同的Id），我得出结论，不同的分片在整个数据集的不同部分上进行搜索，这使我得出结论，分数在某种程度上基于整体给定分片中的数据，而不仅仅是搜索引擎实际考虑的文档 .

问题是，这个得分究竟是如何运作的？我的意思是，你能告诉我/给我看/给我一个确切的公式来计算ES发现的每个文件的分数吗？最终，这个评分机制如何改变？

3 回答

1
分数变化基于给定分片中的数据（如您所怀疑的那样） . 默认情况下，ES使用名为' query then fetch ' which, sends the query to each shard, finds all the matching documents with scores using local TDIFs (this will vary based on data on a given shard - here'的搜索类型来解决您的问题） .

您可以使用' dfs query then fetch '搜索类型更改此选项 - 预先查询每个分片询问术语和文档频率，然后向每个分片等发送查询 .

您可以在网址中设置它
```
$ curl -XGET '/index/type/search?pretty=true&search_type=dfs_query_then_fetch' -d '{
  "from": 0,
  "size": 300,
  "explain": true,
  "query": {
    "match": {
      "Name": {
        "query": "ExampleName"
      }
    }
  }
}'
```
回复于 2024-04-28T03:09:17+08:00
2
ElasticSearch文档中的重要说明：
- 什么是相关性：https://www.elastic.co/guide/en/elasticsearch/guide/current/relevance-intro.html
- 相关性评分背后的理论：https://www.elastic.co/guide/en/elasticsearch/guide/current/scoring-theory.html
回复于 2024-04-28T03:09:17+08:00
12

默认评分是核心Lucene中的DefaultSimilarity算法，largely documented here . 您可以通过配置your own Similarity或使用类似custom_score query之类的内容来自定义评分 .

显示的前五个结果中的奇数分数变化看起来很小，以至于它与我的关系不大，只要查询结果的有效性及其排序，但如果你想了解它的原因，explain api可以显示你究竟发生了什么 .

回复于 2024-04-28T03:09:17+08:00

ElasticSearch默认评分机制

3 回答

相关问题