【技术实现步骤摘要】
问答方法、问答装置、电子设备及存储介质
[0001]本申请涉及人工智能
,尤其涉及一种问答方法
、
问答装置
、
电子设备及存储介质
。
技术介绍
[0002]智能问答系统是以历史问答数据作为训练语料训练出来的大语言模型
(Large Language Models,LLM)。
大语言模型是生成式模型,会使智能问答系统输出模型胡编乱造的答案
。
当预设对象向智能问答系统提问时,智能问答系统无法准确生成该问题的答案,降低了生成答案的准确性
。
技术实现思路
[0003]本申请实施例的主要目的在于提出一种问答方法
、
问答装置
、
电子设备及存储介质,旨在提高智能问答系统生成答案的准确性
。
[0004]为实现上述目的,本申请实施例的第一方面提出了一种问答方法,所述方法包括:
[0005]获取问题数据;
[0006]基于所述问题数据,对多个预设的候选回答动作进行动作选取,得到目标回答动作;
[0007]执行所述目标回答动作,得到与所述问题数据匹配的初始答案数据;
[0008]将所述初始答案数据发送给预设对象,并接收所述预设对象根据所述初始答案数据反馈的第一动作评分数据;
[0009]通过预设强化学习网络对所述目标回答动作进行动作评分,得到第二动作评分数据;
[0010]根据所述第一动作评分数据和所述第二动作评分数据调整所述目标 ...
【技术保护点】
【技术特征摘要】
1.
问答方法,其特征在于,所述方法包括:获取问题数据;基于所述问题数据,对多个预设的候选回答动作进行动作选取,得到目标回答动作;执行所述目标回答动作,得到与所述问题数据匹配的初始答案数据;将所述初始答案数据发送给预设对象,并接收所述预设对象根据所述初始答案数据反馈的第一动作评分数据;通过预设强化学习网络对所述目标回答动作进行动作评分,得到第二动作评分数据;根据所述第一动作评分数据和所述第二动作评分数据调整所述目标回答动作,得到目标答案数据
。2.
根据权利要求1所述的问答方法,其特征在于,所述执行所述目标回答动作,得到与所述问题数据匹配的初始答案数据,包括:执行所述目标回答动作,对所述问题数据进行语义识别,得到所述问题数据的问题语义向量;根据所述问题语义向量从预设知识库获取所述初始答案数据
。3.
根据权利要求1所述的问答方法,其特征在于,所述执行所述目标回答动作,得到与所述问题数据匹配的初始答案数据,包括:执行所述目标回答动作,将所述问题数据输入至预设的第一问答模型进行答案生成,得到第一答案数据;将所述第一答案数据作为所述初始答案数据
。4.
根据权利要求1所述的问答方法,其特征在于,所述执行所述目标回答动作,得到与所述问题数据匹配的初始答案数据,包括:执行所述目标回答动作,将所述问题数据输入至预设的第一问答模型进行答案生成,得到第一答案数据;对所述第一答案数据进行评分,得到答案评分数据;若所述答案评分数据大于或者等于预设评分阈值,将所述问题数据
、
所述第一答案数据和预设历史问答数据进行数据拼接,得到融合问答数据;将所述融合问答数据输入至预设的第二问答模型进行答案生成,得到所述初始答案数据
。5.
根据权利要求1所述的问答方法,其特征在于,所述执行所述目标回答动作,得到与所述问题数据匹配的初始答案数据,包括:执行所述目标回答动作,将所述问题数据输入至预设的第一问答模型进行答案生成,得到第一答案数据;...
【专利技术属性】
技术研发人员:王伟,陈焕坤,郭勇,温小明,郑诣枫,张兴,张黔,曾志贤,
申请(专利权)人:华润数字科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。