System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 检索结果的确定方法及装置、存储介质、电子装置制造方法及图纸_技高网

检索结果的确定方法及装置、存储介质、电子装置制造方法及图纸

技术编号:40298582 阅读:14 留言:0更新日期:2024-02-07 20:46
本申请实施例提供了一种检索结果的确定方法及装置、存储介质、电子装置,其中,该方法包括:检索结果的确定方法,其特征在于,包括:检索与目标问题对应的N条第一检索结果;利用每条第一检索结果的可用性得分和每条第一检索结果的文本特征,确定每条第一检索结果的评价得分,得到N个评价得分;基于N个评价得分从N条第一检索结果中确定M条第二检索结果;利用每条第二检索结果和目标问题组成的拼接语句检索得到M条目标检索结果。通过本申请,解决了相关技术中对问题的检索准确性低的问题,达到增加检索准确性的效果。

【技术实现步骤摘要】

本申请实施例涉及计算机领域,具体而言,涉及一种检索结果的确定方法及装置、存储介质、电子装置


技术介绍

1、目前,通过检索外部相关信息作为prompt进行上下文学习的方式来增强大语言模型(large language model,简称为llm)的生成结果,以解决llm 对于一些时效性比较强的问题无法给出或者给出过时答案的问题。但是,检索增强并不总是有效,甚至有时还会起到反作用,并不能准确的检索出准确的结果。


技术实现思路

1、本申请实施例提供了一种检索结果的确定方法及装置、存储介质、电子装置,以至少解决相关技术中对问题的检索准确性低的问题。

2、根据本申请的一个实施例,提供了一种检索结果的确定方法,包括:检索与目标问题对应的n条第一检索结果,其中,n条上述第一检索结果中均包括上述目标问题的答案,上述n是大于或等于1的自然数;利用每条上述第一检索结果的可用性得分和每条上述第一检索结果的文本特征,确定每条上述第一检索结果的评价得分,得到n个上述评价得分,其中,上述可用性得分用于表示上述第一检索结果与上述目标问题的相关度;基于n个上述评价得分从n条上述第一检索结果中确定m条第二检索结果,其中,每条上述第二检索结果的评价得分均大于第一预设阈值,上述m是小于或等于上述n的自然数;利用每条上述第二检索结果和上述目标问题组成的拼接语句检索得到m条目标检索结果。

3、根据本申请的另一个实施例,提供了一种检索结果的确定装置,包括:第一获取模块,用于检索与目标问题对应的n条第一检索结果,其中,n条上述第一检索结果中均包括上述目标问题的答案,上述n是大于或等于1的自然数;第一确定模块,用于利用每条上述第一检索结果的可用性得分和每条上述第一检索结果的文本特征,确定每条上述第一检索结果的评价得分,得到n个上述评价得分,其中,上述可用性得分用于表示上述第一检索结果与上述目标问题的相关度;第二确定模块,用于基于n个上述评价得分从n条上述第一检索结果中确定m条第二检索结果,其中,每条上述第二检索结果的评价得分均大于第一预设阈值,上述m是小于或等于上述n的自然数;第一输入模块,用于利用每条上述第二检索结果和上述目标问题组成的拼接语句检索得到m条目标检索结果。

4、在一个示例性实施例中,上述第一获取模块,包括:第一获取单元,用于获取与上述目标问题存在相关性的文本信息;第一输入单元,用于将上述目标问题和上述文本信息之间的组合文本输入至检索增强模型中,得到上述检索增强模型输出的n条上述第一检索结果,其中,上述检索增强模型是基于自注意力模型构建的模型,上述组合文本是上述目标问题和上述文本信息中的多条文本随机组合生成的文本集合。

5、在一个示例性实施例中,上述第一确定模块,包括:第一处理单元,用于对每条上述第一检索结果均执行以下步骤,得到n个上述评价得分:将上述第一检索结果输入至目标评价模型,得到上述目标评价模型输出的上述可用性得分,其中,上述目标评价模型是基于bert模型构建的模型;确定上述第一检索结果的相关性得分、文本质量得分以及数据新鲜度得分,得到上述文本特征,其中,上述相关性得分用于表示上述第一检索结果与上述目标问题之间的语义相关度,上述文本质量得分用于表示上述第一检索结果的准确性、清晰度、连贯性以及逻辑性,上述数据新鲜度得分用于表示获取上述第一检索结果的时间和当前时间之间的时间间隔;计算上述可用性得分、上述相关性得分、上述文本质量得分以及上述数据新鲜度得分的加权平均值,得到上述评价得分。

6、在一个示例性实施例中,上述装置还包括:第一构建模块,用于将上述第一检索结果输入至目标评价模型,得到上述目标评价模型输出的上述可用性得分之前,构建样本数据集,其中,上述样本数据集中包括多个样本问题和多个上述样本问题对应的多个样本检索结果,多个上述样本检索结果中包括预设比例的正样本检索结果和负样本检索结果,上述正样本检索结果为语义相似度大于或等于第二预设阈值的样本,上述负样本检索结果为上述语义相似度小于上述第二预设阈值的样本;第一训练模块,用于利用上述样本数据集训练原始评价模型,得到上述目标评价模型。

7、在一个示例性实施例中,上述第一构建模块,包括:第二输入单元,用于将每个上述样本问题输入至上述自注意力模型,得到上述自注意力模型输出的每个上述样本问题对应的第一样本结果;第三输入单元,用于将每个上述样本问题和对应的上述第一样本结果输入至检索增强模型,得到上述检索增强模型输出的第二样本结果;第一确定单元,用于将每个上述样本问题对应的上述第一样本结果、上述第二样本结果以及第三样本结果确定为上述样本数据集,其中,上述第三样本结果为每个上述样本问题对应的样本答案。

8、在一个示例性实施例中,上述装置还包括:第三确定模块,用于确定上述第一样本结果和上述第三样本结果之间的第一语义相似度,以及上述第二样本结果和上述第三样本结果之间的第二语义相似度;第四确定模块,用于将上述第一语义相似度大于上述第二语义相似度的样本结果确定为上述负样本检索结果;第五确定模块,用于将上述第一语义相似度小于或等于上述第二语义相似度的样本结果确定为上述正样本检索结果。

9、在一个示例性实施例中,上述第一处理单元通过以下方式将上述第一检索结果输入至目标评价模型,得到上述目标评价模型输出的上述可用性得分:将上述第一检索结果和上述目标问题输入至目标评价模型,以通过上述目标评价模型从上述第一检索结果中提取多个检索关键词,并计算多个上述检索关键词和其他检索结果之间的相关性得分,按照多个上述检索关键词和上述其他检索结果之间的相关性得分计算得到上述可用性得分,上述其他检索结果为n条上述第一检索结果中的检索结果。

10、在一个示例性实施例中,上述第一处理单元通过以下方式确定上述第一检索结果的相关性得分:提取上述第一检索结果中的多个检索关键词;计算上述第一检索结果中的多个检索关键词与上述目标问题中的问题关键词之间的相关度,得到上述相关性得分。

11、在一个示例性实施例中,上述第一处理单元通过以下方式确定上述第一检索结果的文本质量得分:将上述第一检索结果输入至文本质量评分模型中,得到上述文本质量评分模型输出的上述文本质量得分,其中,上述文本质量评分模型用于随机组合上述第一检索结果中的多个检索关键词,以从多个组合语句中确定上述第一检索结果的语义的准确性、清晰度、连贯性以及逻辑性,上述文本质量评分模型是基于上述bert模型构建的模型。

12、在一个示例性实施例中,上述第一处理单元通过以下方式确定上述第一检索结果的数据新鲜度得分:确定从检索增强模型中输出上述第一检索结果的时间,得到获取上述第一检索结果的时间;对获取上述第一检索结果的时间和上述当前时间之间的时间间隔进行归一化处理,得到上述数据新鲜度得分。

13、在一个示例性实施例中,上述第二确定模块,包括:第一排序单元,用于按照n个上述评价得分对n个上述第一检索结果进行重排序操作,得到目标序列;第二确定单元,用于将上述目标序列中上述本文档来自技高网...

【技术保护点】

1.一种检索结果的确定方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,检索与目标问题对应的N条第一检索结果,包括:

3.根据权利要求1所述的方法,其特征在于,利用每条所述第一检索结果的可用性得分和每条所述第一检索结果的文本特征,确定每条所述第一检索结果的评价得分,得到N个所述评价得分,包括:

4.根据权利要求3所述的方法,其特征在于,将所述第一检索结果输入至目标评价模型,得到所述目标评价模型输出的所述可用性得分之前,所述方法还包括:

5.根据权利要求4所述的方法,其特征在于,构建样本数据集,包括:

6.根据权利要求5所述的方法,其特征在于,所述方法还包括:

7.根据权利要求3所述的方法,其特征在于,将所述第一检索结果输入至目标评价模型,得到所述目标评价模型输出的所述可用性得分,包括:

8.根据权利要求3所述的方法,其特征在于,通过以下方式确定所述第一检索结果的相关性得分:

9.根据权利要求3所述的方法,其特征在于,通过以下方式确定所述第一检索结果的文本质量得分:p>

10.根据权利要求3所述的方法,其特征在于,通过以下方式确定所述第一检索结果的数据新鲜度得分:

11.根据权利要求1所述的方法,其特征在于,基于N个所述评价得分从N条所述第一检索结果中确定M条第二检索结果,包括:

12.根据权利要求1所述的方法,其特征在于,利用每条所述第二检索结果和所述目标问题组成的拼接语句检索得到M条目标检索结果,包括:

13.根据权利要求1所述的方法,其特征在于,利用每条所述第二检索结果和所述目标问题组成的拼接语句检索得到M条目标检索结果之后,所述方法还包括:

14.根据权利要求1所述的方法,其特征在于,利用每条所述第二检索结果和所述目标问题组成的拼接语句检索得到M条目标检索结果之后,所述方法还包括:

15.一种检索结果的确定装置,其特征在于,包括:

16.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被处理器执行时实现所述权利要求1至14任一项中所述的方法的步骤。

17.一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现所述权利要求1至14任一项中所述的方法的步骤。

...

【技术特征摘要】

1.一种检索结果的确定方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,检索与目标问题对应的n条第一检索结果,包括:

3.根据权利要求1所述的方法,其特征在于,利用每条所述第一检索结果的可用性得分和每条所述第一检索结果的文本特征,确定每条所述第一检索结果的评价得分,得到n个所述评价得分,包括:

4.根据权利要求3所述的方法,其特征在于,将所述第一检索结果输入至目标评价模型,得到所述目标评价模型输出的所述可用性得分之前,所述方法还包括:

5.根据权利要求4所述的方法,其特征在于,构建样本数据集,包括:

6.根据权利要求5所述的方法,其特征在于,所述方法还包括:

7.根据权利要求3所述的方法,其特征在于,将所述第一检索结果输入至目标评价模型,得到所述目标评价模型输出的所述可用性得分,包括:

8.根据权利要求3所述的方法,其特征在于,通过以下方式确定所述第一检索结果的相关性得分:

9.根据权利要求3所述的方法,其特征在于,通过以下方式确定所述第一检索结果的文本质量得分:

10.根据权利要求3所述的方法,其特征在于,通过以下方式确定...

【专利技术属性】
技术研发人员:张辉
申请(专利权)人:苏州元脑智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1