问答方法技术

技术编号:39511298 阅读:7 留言:0更新日期:2023-11-25 18:47
本申请提供了一种问答方法

【技术实现步骤摘要】
问答方法、问答装置、电子设备及存储介质


[0001]本申请涉及人工智能
,尤其涉及一种问答方法

问答装置

电子设备及存储介质


技术介绍

[0002]智能问答系统是以历史问答数据作为训练语料训练出来的大语言模型
(Large Language Models,LLM)。
大语言模型是生成式模型,会使智能问答系统输出模型胡编乱造的答案

当预设对象向智能问答系统提问时,智能问答系统无法准确生成该问题的答案,降低了生成答案的准确性


技术实现思路

[0003]本申请实施例的主要目的在于提出一种问答方法

问答装置

电子设备及存储介质,旨在提高智能问答系统生成答案的准确性

[0004]为实现上述目的,本申请实施例的第一方面提出了一种问答方法,所述方法包括:
[0005]获取问题数据;
[0006]基于所述问题数据,对多个预设的候选回答动作进行动作选取,得到目标回答动作;
[0007]执行所述目标回答动作,得到与所述问题数据匹配的初始答案数据;
[0008]将所述初始答案数据发送给预设对象,并接收所述预设对象根据所述初始答案数据反馈的第一动作评分数据;
[0009]通过预设强化学习网络对所述目标回答动作进行动作评分,得到第二动作评分数据;
[0010]根据所述第一动作评分数据和所述第二动作评分数据调整所述目标回答动作,得到目标答案数据

[0011]在一些实施例,所述执行所述目标回答动作,得到与所述问题数据匹配的初始答案数据,包括:
[0012]执行所述目标回答动作,对所述问题数据进行语义识别,得到所述问题数据的问题语义向量;
[0013]根据所述问题语义向量从预设知识库获取所述初始答案数据

[0014]在一些实施例,所述执行所述目标回答动作,得到与所述问题数据匹配的初始答案数据,包括:
[0015]执行所述目标回答动作,将所述问题数据输入至预设的第一问答模型进行答案生成,得到第一答案数据;
[0016]将所述第一答案数据作为所述初始答案数据

[0017]在一些实施例,所述执行所述目标回答动作,得到与所述问题数据匹配的初始答案数据,包括:
[0018]执行所述目标回答动作,将所述问题数据输入至预设的第一问答模型进行答案生成,得到第一答案数据;
[0019]对所述第一答案数据进行评分,得到答案评分数据;
[0020]若所述答案评分数据大于或者等于预设评分阈值,将所述问题数据

所述第一答案数据和预设历史问答数据进行数据拼接,得到融合问答数据;
[0021]将所述融合问答数据输入至预设的第二问答模型进行答案生成,得到所述初始答案数据

[0022]在一些实施例,所述执行所述目标回答动作,得到与所述问题数据匹配的初始答案数据,包括:
[0023]执行所述目标回答动作,将所述问题数据输入至预设的第一问答模型进行答案生成,得到第一答案数据;
[0024]对所述第一答案数据进行评分,得到答案评分数据;
[0025]若所述答案评分数据小于预设评分阈值,则生成第二答案数据,并将所述第二答案数据作为所述初始答案数据

[0026]在一些实施例,所述基于所述问题数据,对多个预设的候选回答动作进行动作选取,得到目标回答动作,包括:
[0027]基于所述问题数据,确定动作选取策略;
[0028]根据所述动作选取策略对多个所述候选回答动作进行动作选取,得到所述目标回答动作

[0029]在一些实施例,所述通过预设强化学习网络对所述目标回答动作进行动作评分,得到第二动作评分数据,包括:
[0030]对所述问题数据进行向量化处理,得到问题特征;
[0031]对所述问题特征和所述目标回答动作进行特征拼接,得到拼接特征;
[0032]将所述拼接特征输入至所述预设强化学习网络进行动作评分,得到所述第二动作评分数据

[0033]为实现上述目的,本申请实施例的第二方面提出了一种问答装置,所述装置包括:
[0034]获取模块,用于获取问题数据;
[0035]动作选取模块,用于基于所述问题数据,对多个预设的候选回答动作进行动作选取,得到目标回答动作;
[0036]动作执行模块,用于执行所述目标回答动作,得到与所述问题数据匹配的初始答案数据;
[0037]第一动作评分模块,用于将所述初始答案数据发送给预设对象,并接收所述预设对象根据所述初始答案数据反馈的第一动作评分数据;
[0038]第二动作评分模块,用于通过预设强化学习网络对所述目标回答动作进行动作评分,得到第二动作评分数据;
[0039]动作调整模块,用于根据所述第一动作评分数据和所述第二动作评分数据调整所述目标回答动作,得到目标答案数据

[0040]为实现上述目的,本申请实施例的第三方面提出了一种电子设备,所述电子设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时
实现上述第一方面所述的问答方法

[0041]为实现上述目的,本申请实施例的第四方面提出了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面所述的问答方法

[0042]本申请提出的问答方法

问答装置

电子设备及计算机可读存储介质
,
其通过获取问题数据,基于问题数据对多个预设的候选回答动作进行动作选取,得到目标回答动作

执行目标回答动作,以通过目标回答动作响应预设对象的提问,对问题数据进行回答,得到与问题数据匹配的初始答案数据

将初始答案数据发送给预设对象,并接收预设对象根据初始答案数据反馈的第一动作评分数据

若第一动作评分数据显示预设对象对于问题生成的初始答案数据不满意,则根据预设对象的反馈调整回答动作,直至生成预设对象满意的答案

通过预设强化学习网络对目标回答动作进行动作评分,得到第二动作评分数据,通过强化学习能够训练智能问答系统以不同的回答动作响应预设对象的提问,而非只能采取一种固定的回答动作,使得智能问答系统对于问题的提问,可以根据第二动作评分数据自适应的调整目标回答动作,以执行准确的回答动作

根据第一动作评分数据和第二动作评分数据调整目标回答动作,得到目标答案数据,通过强化学习与用户反馈机制相结合判断目标回答动作是否是最优动作,并进行回答动作调整,从而使智能问答系统能够执行准确的回答动作,降低了智能问答系统生成胡编乱造答案的概率,提本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
问答方法,其特征在于,所述方法包括:获取问题数据;基于所述问题数据,对多个预设的候选回答动作进行动作选取,得到目标回答动作;执行所述目标回答动作,得到与所述问题数据匹配的初始答案数据;将所述初始答案数据发送给预设对象,并接收所述预设对象根据所述初始答案数据反馈的第一动作评分数据;通过预设强化学习网络对所述目标回答动作进行动作评分,得到第二动作评分数据;根据所述第一动作评分数据和所述第二动作评分数据调整所述目标回答动作,得到目标答案数据
。2.
根据权利要求1所述的问答方法,其特征在于,所述执行所述目标回答动作,得到与所述问题数据匹配的初始答案数据,包括:执行所述目标回答动作,对所述问题数据进行语义识别,得到所述问题数据的问题语义向量;根据所述问题语义向量从预设知识库获取所述初始答案数据
。3.
根据权利要求1所述的问答方法,其特征在于,所述执行所述目标回答动作,得到与所述问题数据匹配的初始答案数据,包括:执行所述目标回答动作,将所述问题数据输入至预设的第一问答模型进行答案生成,得到第一答案数据;将所述第一答案数据作为所述初始答案数据
。4.
根据权利要求1所述的问答方法,其特征在于,所述执行所述目标回答动作,得到与所述问题数据匹配的初始答案数据,包括:执行所述目标回答动作,将所述问题数据输入至预设的第一问答模型进行答案生成,得到第一答案数据;对所述第一答案数据进行评分,得到答案评分数据;若所述答案评分数据大于或者等于预设评分阈值,将所述问题数据

所述第一答案数据和预设历史问答数据进行数据拼接,得到融合问答数据;将所述融合问答数据输入至预设的第二问答模型进行答案生成,得到所述初始答案数据
。5.
根据权利要求1所述的问答方法,其特征在于,所述执行所述目标回答动作,得到与所述问题数据匹配的初始答案数据,包括:执行所述目标回答动作,将所述问题数据输入至预设的第一问答模型进行答案生成,得到第一答案数据;...

【专利技术属性】
技术研发人员:王伟陈焕坤郭勇温小明郑诣枫张兴张黔曾志贤
申请(专利权)人:华润数字科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1