-
6 votesanswersviews
Elasticsearch基于事件的衰减分数
我正试图找到一种方法来防止多个帖子出现在来自同一作者的搜索结果中 . 到目前为止,我已经尝试过随机评分,这让我可以保持分页 . 但是,在10个结果的给定页面中,我仍然可以拥有多达4个相同的作者 . 有没有办法根据结果集中某个字段出现的次数对文档进行评分?据我所知,你不能在评分脚本中保留变量或对象 . 我已经研究了几种实现这一目标的方法,但其中很多都有不少缺点 . 例如删除重复项,然后再次调用以检索... -
7 votesanswersviews
确定多个权重测验的“难度”?
Im trying to determine the "difficultly" of a quiz object. 我的最终目标是能够为任何测验创建一个 "difficulty score" (DS) . 这将允许我准确地比较一个测验与另一个测验,尽管由不同的问题/答案组成 . 在创建我的测验对象时,我为每个问题指定一个 "difficulty ... -
10 votesanswersviews
ElasticSearch默认评分机制
我正在寻找的是ElasticSearch(Lucene)的默认评分机制如何真正起作用的简单清晰的解释 . 我的意思是,它是否使用Lucene得分,或者它可能使用自己的得分? 例如,我想通过例如“名称”字段搜索文档 . 我使用.NET NEST客户端来编写查询 . 我们来考虑这种类型的查询: IQueryResponse<SomeEntity> queryResult = client.... -
3 votesanswersviews
Elasticsearch数组评分
我正在使用elasticsearch搜索我的类型中的多个数组字段,看起来像 t1 = { field1: ["foo", "bar"], field2: ["foo", "foo", "foo", "foo"] field3: ["fo... -
5 votesanswersviews
当结果具有相同的分数时,在Elasticsearch中进行分页
如果多个文档具有相同的分数,是否可以实现elasticsearch搜索结果的可靠分页? 我在弹性搜索中尝试自定义评分 . 我尝试的许多得分表达式产生结果集,其中许多文档具有相同的分数 . 每次尝试时它们似乎都以相同的顺序出现,但可以保证吗? AFAIU它不能,特别是如果集群中有多个分片 . 具有相同分数的文件 . 给定的elasticsearch查询以随机,非确定性顺序返回,即使基础数据库不发生更... -
0 votesanswersviews
应用评分时,ElasticSearch会显示不太相关的结果
我在ElasticSearch 0.9中有一个索引,其中包含以下文档: {"Id":1, "Title":"Hello World" , "Popularity":1}, {"Id":2, "Title":"Hello World" , "Popu... -
1 votesanswersviews
Elasticsearch看似随机得分和匹配
我正在使用 bool 搜索来匹配多个字段 . 这些字段已在索引时使用多个过滤器进行分析,但主要使用 edge_ngram . 我遇到的问题是得分似乎在空中 . 我希望我的搜索 savvas 首先匹配 Savvas 的 first_name 字段中的一个,但是它们的得分要晚得多 . 例如,搜索 savvas 按得分顺序返回: First name | Last name | Email... -
1 votesanswersviews
Elasticsearch评分基于匹配的令牌的比率
我正在使用Elasticsearch(v 1.7.3,带有Java传输客户端)来搜索人名数据库 . 我正在利用一堆可用的语音算法(DoubleMetaphone,RefinedSoundex等)来索引我的名字字段并存储它们 . 但是,我需要的评分算法是计算输入令牌与索引中的一个接近度的百分比 . 例如: 以下文档,使用语音算法进行索引时: { "FullName": &qu... -
1 votesanswersviews
在h2o深度学习中用噪声评分历史
我在Python中使用h2o Deep Learning . 我的问题是时间序列预测问题,因为我想预测太阳黑子数量的演变 . 以下是自1749年以来太阳黑子的所有 Value :http://www.sidc.be/silso/DATA/SN_ms_tot_V2.0.txt . 我想使用43个月的滑动窗口,因此我的数据集现在由44列和3170行组成(我想要预测的值是第44个,基于前一个月的第43个... -
7 votesanswersviews
如何在scikit-learn的LogisticRegressionCV调用中将参数传递给评分函数
Problem 我正在尝试使用scikit-learn的LogisticRegressionCV和roc_auc_score作为评分指标 . from sklearn.linear_model import LogisticRegression from sklearn.metrics import roc_auc_score clf = LogisticRegressionCV(scoring... -
2 votesanswersviews
LinearRegression():使用cross_val_score进行R2评分 - 结果很奇怪
我正在使用cross_val_score()函数计算我的拟合系数.2605614_ . 这是我的代码: from sklearn.linear_model import LinearRegression from sklearn.model_selection import cross_val_score X = data.iloc[:,0:13] y = data.iloc[:,13] lin ... -
0 votesanswersviews
如何使用来自sklearn的GridSearchCV为回归设置自己的得分?
我曾经使用GridSearchCV(...评分=“准确度”...)来分类模型 . 现在我将使用GridSearchCV作为回归模型,并使用自己的错误函数设置评分 . 示例代码: def rmse(predict, actual): predict = np.array(predict) actual = np.array(actual) distance = predic... -
2 votesanswersviews
ElasticSearch:具有edge_ngram和模糊性的部分/精确评分
在ElasticSearch中,我试图使用edge_ngram以及模糊来获得正确的评分 . 我希望完全匹配得分最高,子匹配得分较低 . 以下是我的设置和评分结果 . settings: { number_of_shards: 1, analysis: { filter: { ngram_filter:... -
1 votesanswersviews
Applied NLP:如何根据多字词的词汇对文档进行评分?
这可能是一个相当基本的NLP问题,但我手头有以下任务:我有一组文本文档,我需要根据一个(英语)词汇进行评分,这些词汇可以是1-,2-,3-等 N - 字长 . N 受到一些"reasonable"数字的限制,但字典中各种术语的分布对于 n = 1, ..., N 的各种值可能相当均匀 . 例如,该词典可以包含某种类型的设备列表,并且我想查看给定文档是否可能与这些设备中的任...