System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 问答背景信息的生成方法、装置、设备及存储介质制造方法及图纸_技高网

问答背景信息的生成方法、装置、设备及存储介质制造方法及图纸

技术编号:40503621 阅读:6 留言:0更新日期:2024-03-01 13:17
本申请公开了一种问答背景信息的生成方法、装置、设备及存储介质,涉及人工智能领域。该问答背景信息的生成方法包括:基于知识语料信息,生成多个问答对,问答对包括问题和问题对应的答案;针对每个问答对,分别计算问答对中问题与用户问题的相似度以及问答对中答案与用户问题的相似度,并根据相似度得到问答对的综合相似度;将多个问答对中答案相同的问答对划分为一组,得到多个分组,形成多个问答对集合;根据问答对集合中各个问答对的综合相似度,确定问答对集合中各问答对集合的集合相似度;从问答对集合中筛选集合相似度满足预设阈值的目标问答对集合,并将目标问答对集合中的问答对确定为用户问题的问答背景信息。

【技术实现步骤摘要】

本申请属于人工智能,尤其涉及一种问答背景信息的生成方法、装置、设备及存储介质


技术介绍

1、随着人工智能技术的发展,依据大语言模型的智能客服问答应用得到了迅速发展。智能客服问答应用的实现思路是将用户的问题和问答背景信息作为输入给到大语言模型,由模型理解后输出问答结果。

2、目前关于问答背景信息的生成方法主要通过将知识语料信息进行切割,形成一个个不同的问答对,当输入用户问题后,找到与用户问题相似度最高的问答对作为大语言模型的问答背景信息,从而依此回答用户问题。

3、然而,此方法容易出现由于表述方式不同,当与问答对中的问题进行相似度计算时,有些表述语句计算出来的相似度会偏低,匹配不到最正确的问答对,导致大语言模型依此回答的答案准确性较低。


技术实现思路

1、本申请实施例提供了一种问答背景信息的生成方法、装置、设备及存储介质,能够针对用户问题匹配最相关的问答对集合,提升问答对匹配的准确率。

2、本申请实施例的一方面,提供一种问答背景信息的生成方法,该方法包括:

3、基于知识语料信息,生成多个问答对,问答对包括问题和问题对应的答案;

4、针对每个问答对,分别计算问答对中问题与用户问题的相似度以及问答对中答案与用户问题的相似度,并根据相似度得到问答对的综合相似度;

5、将多个问答对中答案相同的问答对划分为一组,得到多个分组,形成多个问答对集合;

6、根据问答对集合中各个问答对的综合相似度,确定问答对集合中各问答对集合的集合相似度;

7、从问答对集合中筛选集合相似度满足预设阈值的目标问答对集合,并将目标问答对集合中的问答对确定为用户问题的问答背景信息,以用于大语言模型根据问答背景信息回答所述用户问题。

8、本申请实施例的一方面,提供一种问答背景信息的生成装置,该装置包括:

9、生成模块,用于基于知识语料信息,生成多个问答对,问答对包括问题和问题对应的答案;

10、获取模块,用于针对每个问答对,分别计算问答对中问题与用户问题的相似度以及问答对中答案与用户问题的相似度,并根据相似度得到问答对的综合相似度;

11、分组模块,用于将多个问答对中答案相同的问答对划分为一组,得到多个分组,形成多个问答对集合;

12、计算模块,用于根据问答对集合中各个问答对的综合相似度,确定问答对集合中各问答对集合的集合相似度;

13、筛选模块,用于从问答对集合中筛选集合相似度满足预设阈值的目标问答对集合,并将目标问答对集合中的问答对确定为用户问题的问答背景信息,以用于大语言模型根据问答背景信息回答所述用户问题。

14、本申请实施例的一方面,提供一种电子设备,该问答背景信息的生成设备包括:存储器及存储在存储器上并可在处理器上运行的程序或指令,程序或指令被处理器执行时实现如上述本申请实施例的任意一方面提供的问答背景信息的生成方法。

15、本申请实施例的一方面,提供一种可读存储介质,可读存储介质上存储程序或指令,程序或指令被处理器执行时实现如上述本申请实施例的任意一方面提供的问答背景信息的生成方法。

16、本申请实施例的一方面,提供一种计算机程序产品,计算机程序产品中的指令由电子设备的处理器执行时,使得电子设备执行如上述本申请实施例的任意一方面提供的问答背景信息的生成方法。

17、本申请实施例提供的问答背景信息的生成方法中,首先基于知识语料信息,生成多个问答对,考虑到了每一个知识片段的可能提问方式,泛化形成多个问题对应一个答案的问答对。然后针对每个问答对,分别计算问答对中问题与用户问题的相似度以及问答对中答案与用户问题的相似度,并根据相似度得到问答对的综合相似度,并且对问答对进行分组,将答案一致的问答对组合成一个问答对集合,从而形成多个问答对集合。同时根据问答对集合中各个问答对的综合相似度,计算各个问答对集合的集合相似度,最后从问答对集合中筛选集合相似度满足预设阈值的目标问答对集合为用户问题的问答背景信息。如此,本申请实施例综合考虑问答对集合中各个问答对的综合相似度,从而生成各个问答对集合的集合相似度。最后根据问答对集合的集合相似度对问答对集合进行筛选,从而能够针对用户问题匹配最相关的问答对集合生成问答背景信息,综合考虑了用户问题不同表述方式对相似度的影响,大幅提升了问答对匹配的准确率,进而提升大语言模型回答的准确度。

本文档来自技高网...

【技术保护点】

1.一种问答背景信息的生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述基于知识语料信息,生成多个问答对,包括:

3.根据权利要求1所述的方法,其特征在于,所述针对每个所述问答对,分别计算所述问答对中问题与用户问题的相似度以及所述问答对中答案与用户问题的相似度,并根据所述相似度得到问答对的综合相似度之前,所述方法还包括:

4.根据权利要求3所述的方法,其特征在于,所述配置信息还包括问答对最大限值和相似度最小限值,

5.根据权利要求1-4任一项所述的方法,其特征在于,所述针对每个所述问答对,分别计算所述问答对中问题与用户问题的相似度以及所述问答对中答案与用户问题的相似度,并根据所述相似度得到问答对的综合相似度,包括:

6.根据权利要求1所述的方法,其特征在于,所述根据所述问答对集合中各个所述问答对的综合相似度,确定所述问答对集合中各问答对集合的集合相似度,包括:

7.一种问答背景信息的生成装置,其特征在于,所述装置包括:

8.根据权利要求7所述的问答背景信息的生成装置,其特征在于,所述生成模块包括:

9.一种电子设备,其特征在于,所述设备包括:处理器以及存储有计算机程序指令的存储器;

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如权利要求1-6任意一项所述的问答背景信息的生成方法。

...

【技术特征摘要】

1.一种问答背景信息的生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述基于知识语料信息,生成多个问答对,包括:

3.根据权利要求1所述的方法,其特征在于,所述针对每个所述问答对,分别计算所述问答对中问题与用户问题的相似度以及所述问答对中答案与用户问题的相似度,并根据所述相似度得到问答对的综合相似度之前,所述方法还包括:

4.根据权利要求3所述的方法,其特征在于,所述配置信息还包括问答对最大限值和相似度最小限值,

5.根据权利要求1-4任一项所述的方法,其特征在于,所述针对每个所述问答对,分别计算所述问答对中问题与用户问题的相似度以及所述问答对中答案与用户问题的相似度,并...

【专利技术属性】
技术研发人员:陈晓鸿董灿佳黄华新魏宝辉黎智韬黄伟文蔡鑫罗朝彤吴志强
申请(专利权)人:中移动信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1