System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于多算法组合的问答方法、系统、电子设备及存储介质技术方案_技高网

基于多算法组合的问答方法、系统、电子设备及存储介质技术方案

技术编号:40079274 阅读:9 留言:0更新日期:2024-01-17 02:15
本发明专利技术实施例公开了一种基于多算法组合的问答方法、系统、电子设备及存储介质,该方法包括:选取若干机器学习模型算法,并对若干机器学习模型算法进行训练,得到对应的若干问答逻辑模型;选取若干问答逻辑模型中的其中一种作为主算法,将其他若干问答逻辑模型作为辅助算法;将目标问题输入主算法,得到多个答案,选取多个答案中置信度最高的一个作为目标答案;基于目标问题确定目标答案在辅助算法中的置信度;计算目标答案的置信度评分;根据置信度评分确定推送的最终答案。本发明专利技术实施例通过各多种算法的比较推荐,提升了推荐置信度,并对一些算法异常推送进行规避,使用多种算法模型的并行匹配机制,可择优选择,大大提升了答复的准确度。

【技术实现步骤摘要】

本专利技术实施例涉及问答系统,具体涉及一种基于多算法组合的问答方法、系统、电子设备及存储介质


技术介绍

1、问答系统是信息检索的一种高级形式,能够更加准确地理解用户用自然语言提出的问题,并通过检索语料库、知识图谱或问答知识库返回简洁、准确的匹配答案。相较于搜索引擎,问答系统能更好地理解用户提问的真实意图,进一步能更有效地满足用户的信息需求。问答系统是目前人工智能和自然语言处理领域中一个倍受关注并具有广泛发展前景的研究方向。

2、问答系统可分为面向任务、面向知识和面向聊天三类,从关键技术上分,还可以把其分成基于搜索技术的问答系统、基于协同的问答系统、基于知识库的问答系统。

3、面向任务的问答系统是一种闭域应用,通常使用基于规则的或基于模板的方法,并采用对话状态跟踪技术。在帮助服务中所使用的槽位填充方法,就是一种基于模板的方法。

4、面向知识的问答系统可用于闭域和开放域,通常使用以数据为驱动的信息检索模型。该类方法基于从问答知识库中查找与提问问题最匹配的知识。一份最新的研究工作尝试使用基于神经网络的方法实现问题间的匹配。最常用的一种方法是基于知识图谱与信息检索相结合的方法,检索知识图谱可给出高准确率的问答,并以信息检索为补充。

5、基于聊天的问答系统常用于开放域,使用方法包括信息检索和生成模型。

6、现有基于深度学习算法的问答系统,其一般是采用一种模型算法完成答案推荐,这种方式存在以下问题:

7、由于训练的数据或者其他因素的影响,可能会导致部分推荐的答案的准确率较低,甚至出现异常推荐的可能性。


技术实现思路

1、为了克服现有技术的不足,本专利技术实施例的目的在于提供一种基于多算法组合的问答方法、系统、电子设备及存储介质,其通过各多种算法的比较推荐,提升了推荐置信度,并对一些算法异常推送进行规避,同时,使用多种算法模型的并行匹配机制,可择优选择,大大提升了答复的准确度。

2、为解决上述问题,本专利技术实施例第一方面公开一种基于多算法组合的问答方法,其包括以下步骤:

3、选取若干机器学习模型算法,并对所述若干机器学习模型算法进行训练,得到对应的若干问答逻辑模型;

4、选取所述若干问答逻辑模型中的其中一种作为主算法,将其他若干问答逻辑模型作为辅助算法;

5、将目标问题输入所述主算法,得到多个答案,选取所述多个答案中置信度最高的一个作为目标答案;

6、基于所述目标问题确定所述目标答案在所述辅助算法中的置信度;

7、计算所述目标答案的置信度评分:

8、

9、其中,f(x)为目标答案的置信度评分,ax为目标答案在主算法中的置信度;mi为目标答案在第i种辅助算法的排序位置,k为目标答案在所有辅助算法的位置中间值,wi为目标答案在第i种辅助算法的排序位置的权重;ni为目标答案在第i种辅助算法的置信度,j为目标答案在所有辅助算法的置信度中间值,qi为目标答案在第i种辅助算法的置信度的权重值,1≤i≤n,n为辅助算法的总数;

10、根据所述置信度评分确定推送的最终答案。

11、作为可选的方案,在本专利技术实施例的第一方面中,选取所述若干问答逻辑模型中的其中一种作为主算法,将其他若干问答逻辑模型作为辅助算法,包括:

12、基于一个或多个问题样本以及所述一个或多个样本对应的答案信息确定每个问答逻辑模型的置信度;

13、根据所述每个问答逻辑模型的置信度大小进行排序,其中,置信度最大的问答逻辑模型作为主算法,其他问答逻辑模型作为辅助算法。

14、作为可选的方案,在本专利技术实施例的第一方面中,根据所述置信度评分确定推送的最终答案,包括:

15、比对所述置信度评分与置信度预设阈值之间的大小;

16、如果所述置信度评分大于或等于所述置信度预设阈值,则所述目标答案为推送的最终答案;

17、如果所述置信度评分小于所述置信度预设阈值,则将推荐答案列表作为推送的最终答案,所述推荐答案列表为将目标问题输入所述主算法得到的置信度靠前的预设个数的答案。

18、作为可选的方案,在本专利技术实施例的第一方面中,所述方法还包括:

19、将所述最终答案转直接推送给用户,或者将所述最终答案进行相关转换后推送给用户。

20、作为可选的方案,在本专利技术实施例的第一方面中,所述相关转换为将文字转换成图片或者语音。

21、作为可选的方案,在本专利技术实施例的第一方面中,对所述若干机器学习模型算法进行训练,包括:

22、基于日常交互信息确定训练样本集;

23、使用所述训练样本集对所述若干机器学习模型算法进行训练;

24、按照预设时间间隔更新所述训练样本集并基于所述更新的训练样本集对所述若干机器学习模型算法的训练结果进行更新。

25、作为可选的方案,在本专利技术实施例的第一方面中,基于日常交互信息确定训练样本集,包括:

26、对所述日常交互信息的人工标注,获取有效的日常问答信息;

27、对所述日常问答信息进行主观校准和分类,或者通过用户满意度进行校准,得到最终的训练样本集。

28、本专利技术实施例第二方面公开了一种基于多算法组合的问答系统,其包括:

29、第一选取单元,用于选取若干机器学习模型算法,并对所述若干机器学习模型算法进行训练,得到对应的若干问答逻辑模型;

30、第二选取单元,用于选取所述若干问答逻辑模型中的其中一种作为主算法,将其他若干问答逻辑模型作为辅助算法;

31、输入单元,用于将目标问题输入所述主算法,得到多个答案,选取所述多个答案中置信度最高的一个作为目标答案;

32、第一计算单元,用于基于所述目标问题确定所述目标答案在所述辅助算法中的置信度;

33、第二计算单元,用于计算所述目标答案的置信度评分:

34、

35、其中,f(x)为目标答案的置信度评分,ax为目标答案在主算法中的置信度;mi为目标答案在第i种辅助算法的排序位置,k为目标答案在所有辅助算法的位置中间值,wi为目标答案在第i种辅助算法的排序位置的权重;ni为目标答案在第i种辅助算法的置信度,j为目标答案在所有辅助算法的置信度中间值,qi为目标答案在第i种辅助算法的置信度的权重值,1≤i≤n,n为辅助算法的总数;

36、推送单元,用于根据所述置信度评分确定推送的最终答案。

37、本专利技术实施例第三方面公开一种电子设备,包括:存储有可执行程序代码的存储器;与所述存储器耦合的处理器;所述处理器调用所述存储器中存储的所述可执行程序代码,用于执行本专利技术实施例第一方面公开的一种基于多算法组合的问答方法。

38、本专利技术实施例第四方面公开一种计算机可读存储介质,其存储计算机程序,其中,所述计算机程序使得计算机执行本专利技术实施例第一方面公开的一种基于多本文档来自技高网...

【技术保护点】

1.一种基于多算法组合的问答方法,其特征在于,其包括以下步骤:

2.根据权利要求1所述的基于多算法组合的问答方法,其特征在于,选取所述若干问答逻辑模型中的其中一种作为主算法,将其他若干问答逻辑模型作为辅助算法,包括:

3.根据权利要求1所述的基于多算法组合的问答方法,其特征在于,根据所述置信度评分确定推送的最终答案,包括:

4.根据权利要求1所述的基于多算法组合的问答方法,其特征在于,所述方法还包括:

5.根据权利要求4所述的基于多算法组合的问答方法,其特征在于,所述相关转换为将文字转换成图片或者语音。

6.根据权利要求1-5任一项所述的基于多算法组合的问答方法,其特征在于,对所述若干机器学习模型算法进行训练,包括:

7.根据权利要求6所述的基于多算法组合的问答方法,其特征在于,基于日常交互信息确定训练样本集,包括:

8.一种基于多算法组合的问答系统,其特征在于,其包括:

9.一种电子设备,其特征在于,其包括:存储有可执行程序代码的存储器;与所述存储器耦合的处理器;所述处理器调用所述存储器中存储的所述可执行程序代码,用于执行权利要求1-7任一项所述的基于多算法组合的问答方法。

10.一种计算机可读存储介质,其特征在于,其存储计算机程序,其中,所述计算机程序使得计算机执行权利要求1-7任一项所述的基于多算法组合的问答方法。

...

【技术特征摘要】

1.一种基于多算法组合的问答方法,其特征在于,其包括以下步骤:

2.根据权利要求1所述的基于多算法组合的问答方法,其特征在于,选取所述若干问答逻辑模型中的其中一种作为主算法,将其他若干问答逻辑模型作为辅助算法,包括:

3.根据权利要求1所述的基于多算法组合的问答方法,其特征在于,根据所述置信度评分确定推送的最终答案,包括:

4.根据权利要求1所述的基于多算法组合的问答方法,其特征在于,所述方法还包括:

5.根据权利要求4所述的基于多算法组合的问答方法,其特征在于,所述相关转换为将文字转换成图片或者语音。

6.根据权利要求1-5任一项所述的基于多算法组合的问答...

【专利技术属性】
技术研发人员:程德生万晶吴朝阳钱刚张卫星张鹤
申请(专利权)人:杭州中软安人网络通信股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1