System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种评分排序优化方法、装置、设备及存储介质制造方法及图纸_技高网

一种评分排序优化方法、装置、设备及存储介质制造方法及图纸

技术编号:40509149 阅读:3 留言:0更新日期:2024-03-01 13:24
本申请公开了一种评分排序优化的方法、装置、设备及存储介质,涉及数据检索技术领域,该方法包括:获取ElasticSearch搜索引擎基于检索字段输出的多个检索结果以及各检索结果对应的评分,检索字段包括多个关键字段,各检索结果对应的评分基于多个关键字段对应的得分确定,关键字段包括:中文关键字段和/或英文关键字段;对于各检索结果对应的评分,将含义相同的中文关键字段以及英文关键字段所对应的得分记作一半,以得到各检索结果对应的重评估评分;基于各检索结果对应的重评估评分进行多个检索结果的排序,以得到评分结果;从而提高了评分结果的准确性。

【技术实现步骤摘要】

本申请涉及数据检索,尤其涉及一种评分排序优化方法、装置及设备。


技术介绍

1、elasticsearch是一个分布式、高扩展、高实时的搜索与数据分析引擎。它能很方便地使大量数据具有搜索、分析和探索的能力。其中,elasticsearch的实现原理主要分为以下几个步骤,首先用户将数据提交到elasticsearch数据库中,再通过分词控制器去将对应的语句分词,将其权重和分词结果一并存入数据,当用户搜索数据的时候根据权重将结果打分排名,再将返回结果呈现给用户。

2、目前主流的elasticsearch评分机制依赖elasticsearch内置的bm25算法,文档里某个词出现的次数越频繁,文档与这个词越相关,得分越高。评分机制的整个评分过程都是在elasticsearch内部完成。开发人员只需要在数据创建时,将需要评分的字段类型设置为文本text类型,进行分词评分,内部评分机制在检索时就会将分数高的数据默认优先展示。但是,现有技术在排序结果的准确性上仍不理想。


技术实现思路

1、有鉴于此,本申请的主要目的在于提供一种评分排序优化方法、装置、设备及存储介质,目的在于实现提高评估的准确性。

2、本申请第一方面提供了一种评分排序优化方法,该方法包括:

3、获取elasticsearch搜索引擎基于检索字段输出的多个检索结果以及各检索结果对应的评分,检索字段包括多个关键字段,各检索结果对应的评分基于多个关键字段对应的得分确定,关键字段包括:中文关键字段和/或英文关键字段;

4、对于各检索结果对应的评分,将含义相同的中文关键字段以及英文关键字段所对应的得分记作一半,以得到各检索结果对应的重评估评分;

5、基于各检索结果对应的重评估评分进行多个检索结果的排序,以得到评分结果。

6、在本申请第一方面的一些实现方式中,该方法还包括:

7、在评分结果中,过滤掉评分高于上限阈值或低于下限阈值的检索结果。

8、在本申请第一方面的一些实现方式中,对于各检索结果对应的评分,将含义相同的中文关键字段以及英文关键字段所对应的得分记作一半,包括:

9、获取关键字段的数据项长度;

10、当关键字段中的中文关键字段以及英文关键字段的数据项长度均大于零时,对于各检索结果对应的评分,将含义相同的中文关键字段以及英文关键字段所对应的得分记作一半。

11、在本申请第一方面的一些实现方式中,该方法还包括:

12、在评分结果中,过滤掉评分结果中未全部包含多个关键字段的检索结果。

13、在本申请第一方面的一些实现方式中,该方法还包括:

14、确定多个关键字段在检索字段中的出现顺序,以得到检索字段对应的第一关键字段顺序;确定多个关键字段在各检索结果中的出现顺序,以得到各检索结果对应的第二关键字段顺序。

15、在本申请第一方面的一些实现方式中,该方法还包括:

16、在评分结果中,过滤掉第二关键字段顺序与第一关键字段顺序不同的检索结果。

17、在本申请第一方面的一些实现方式中,基于各检索结果对应的重评估评分进行多个检索结果的排序,包括:

18、通过转移各检索结果中的多个关键字段,使各检索结果的第二关键字段顺序与第一关键字段顺序相同,并通过记录转移次数得到各检索结果对应的转移次数;

19、基于各检索结果对应的转移次数以及各检索结果对应的重评估得分进行多个检索结果的排序。

20、本申请第二方面提供了一种评分排序优化装置,该装置包括:

21、获取模块,用于获取elasticsearch搜索引擎基于检索字段输出的多个检索结果以及各检索结果对应的评分,检索字段包括多个关键字段,各检索结果对应的评分基于多个关键字段对应的得分确定,关键字段包括:中文关键字段和/或英文关键字段;

22、重评估模块,用于对于各检索结果对应的评分,将含义相同的中文关键字段以及英文关键字段所对应的得分记作一半,以得到各检索结果对应的重评估评分;

23、排序模块,用于基于各检索结果对应的重评估评分进行多个检索结果的排序,以得到评分结果。

24、本申请第三方面提供了一种评分排序优化设备,其特征在于,设备包括:包括存储器和处理器,处理器用于执行存储器中存储的程序,运行如本申请第一方面所提供的任一项评分排序优化方法。

25、本申请第四方面提供了一种可读存储介质,其上存储有计算机程序,其特征在于,计算机程序被处理器执行时,实现如本申请第一方面所提供的任一项的评分排序优化方法的各个步骤。

26、本申请所提供的技术方案具有如下有益效果:

27、在本申请的实施例中,首先。获取e l ast icsearch搜索引擎基于检索字段输出的多个检索结果以及各检索结果对应的评分,检索字段包括多个关键字段,各检索结果对应的评分基于多个关键字段对应的得分确定,关键字段包括:中文关键字段和/或英文关键字段;然后,对于各检索结果对应的评分,将含义相同的中文关键字段以及英文关键字段所对应的得分记作一半,以得到各检索结果对应的重评估评分;最后,基于各检索结果对应的重评估评分进行多个检索结果的排序,以得到评分结果。可见,本申请考虑到了检索字段中含义相同的中英文关键字段对检索结果评分的影响,并且通过得分减半的方式降低了中英文关键字段对检索结果对应的评分的影响,使得最终排序后生成的评分结果更具准确性。

本文档来自技高网...

【技术保护点】

1.一种评分排序优化方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

3.根据权利要求1所述的方法,其特征在于,所述对于所述各检索结果对应的评分,将含义相同的所述中文关键字段以及所述英文关键字段所对应的得分记作一半,包括:

4.根据权利要求1所述的方法,其特征在于,所述方法还包括:

5.根据权利要求1所述的方法,其特征在于,所述方法还包括:

6.根据权利要求5所述的方法,其特征在于,所述方法还包括:

7.根据权利要求5所述的方法,其特征在于,所述基于各所述检索结果对应的重评估评分进行所述多个检索结果的排序,包括:

8.一种评分排序优化装置,其特征在于,所述装置包括:

9.一种评分排序优化设备,其特征在于,所述设备包括:包括存储器和处理器,所述处理器用于执行所述存储器中存储的程序,运行如权利要求1至7任一项所述的评分排序优化方法。

10.一种可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如权利要求1至7中任一项所述的评分排序优化方法的各个步骤。

...

【技术特征摘要】

1.一种评分排序优化方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

3.根据权利要求1所述的方法,其特征在于,所述对于所述各检索结果对应的评分,将含义相同的所述中文关键字段以及所述英文关键字段所对应的得分记作一半,包括:

4.根据权利要求1所述的方法,其特征在于,所述方法还包括:

5.根据权利要求1所述的方法,其特征在于,所述方法还包括:

6.根据权利要求5所述的方法,其特征在于,所述方法还包括:

7...

【专利技术属性】
技术研发人员:冯建
申请(专利权)人:中国农业银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1