机器人对话模型的训练方法、装置、设备及存储介质制造方法及图纸

技术编号:31496308 阅读:29 留言:0更新日期:2021-12-18 12:38
本发明专利技术涉及人工智能,提供一种机器人对话模型的训练方法、装置、计算机设备及存储介质。方法包括:通过预设的训练后的用户模拟器以及预设的机器人对话模型进行对话生成真实经验;通过真实经验以及预设的用户对话数据样本集对预设的用户对话模型进行训练,得到训练后的用户对话模型;通过训练后的用户对话模型与预设的机器人对话模型进行对话,并根据对对话进行评分,得到模拟经验;根据模拟经验、真实经验以及用户对话数据样本集分别对预设的机器人对话模型进行训练,得到训练后的机器人对话模型。本方案可以通过用户模拟器以及用户对话模型扩充训练语料,通过扩充后的训练语料对机器人对话模型进行训练,可以提高机器人对话模型的对话质量。的对话质量。的对话质量。

【技术实现步骤摘要】
机器人对话模型的训练方法、装置、设备及存储介质


[0001]本专利技术涉及人工智能
,尤其涉及一种机器人对话模型的训练方法、装置、计算机设备及存储介质。

技术介绍

[0002]对话机器人作为自然语言处理领域的重要组成部分,它可以为用户提供框架性的即时消息传递服务,也可以为用户提供快速的机器会话服务,解决用户工作和生活中的问题。
[0003]随着技术的不断发展,用户体验在人工智能(Artificial Intelligence,AI)中的表现也被日渐重视,所以需要训练出回答更精确的机器人对话模型,现有技术中,需要通过现有的对话语料对机器人对话模型进行强化学习,从而得到训练后的机器人对话模型,但是现有的对话语料非常稀缺,所以直接使用现有的对话语料对机器人对话模型进行强化学习,会导致训练出来的机器人对话模型的对话质量差。

技术实现思路

[0004]本专利技术实施例提供了一种机器人对话模型的训练方法、装置、计算机设备及存储介质,可以提高机器人对话模型的对话质量。
[0005]第一方面,本专利技术实施例提供了一种机器本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种机器人对话模型的训练方法,其特征在于,包括:通过预设的训练后的用户模拟器以及预设的机器人对话模型进行对话生成真实经验;通过所述真实经验以及预设的用户对话数据样本集对预设的用户对话模型进行训练,得到训练后的用户对话模型;通过所述训练后的用户对话模型与所述预设的机器人对话模型进行对话,并根据预设的评分规则对所述对话进行评分,得到模拟经验;根据所述模拟经验、所述真实经验以及所述用户对话数据样本集分别对所述预设的机器人对话模型进行训练,得到训练后的机器人对话模型。2.根据权利要求1所述的方法,其特征在于,所述通过所述训练后的用户对话模型与所述预设的机器人对话模型进行对话,并根据预设的评分规则对所述对话进行评分,得到模拟经验,包括:从预设的用户目标数据库中获取用户目标;根据所述用户目标触发所述预设的机器人对话模型以及所述训练后的用户对话模型进入与用户目标对应的对话工作状态;在每轮对话中,将当前轮次的当前对话状态以及上一轮次的机器响应输入所述训练后的用户对话模型进行对话处理,得到所述当前轮次的用户响应,所述机器响应为所述预设的机器人对话模型输出的对话响应;根据所述当前轮次的用户响应对所述当前对话状态进行更新,得到更新后对话状态;根据所述预设的评分规则以及所述当前对话状态对所述上一轮次的机器响应进行评分,得到奖励值;根据所述当前对话状态、所述当前轮次的用户响应、所述更新后对话状态以及所述奖励值生成所述模拟经验。3.根据权利要求2所述的方法,其特征在于,所述根据所述当前轮次的用户响应对所述当前对话状态进行更新,得到更新后对话状态,包括:通过对所述用户响应进行语义分析确定所述用户响应的槽值;根据所述槽值对当前对话状态中所述用户目标对应的语义槽的对应槽位进行填充,得到所述更新后对话状态。4.根据权利要求3所述的方法,其特征在于,所述根据所述槽值对当前对话状态中所述用户目标对应的语义槽的对应槽位进行填充,得到所述更新后对话状态,包括:将所述槽值填充至所述当前对话状态中所述用户目标对应的语义槽的对应槽位中,得到语义槽填充情况;若所述语义槽填充情况为所述语义槽已填充满,并且当前总对话轮次小于或等于预设的轮数阈值,则确定所述更新后对话状态为成功状态;若所述语义槽填充情况为所述语义槽未填充满,并且当前总对话轮次小于或等于预设的轮数阈值,则确定所述更新后对话状态为对话进行中状态;若所述语义槽填充情况为所述语义槽未填充满,并且当前总对话轮次大于预设的轮数阈值,则确定所述更新后对话状态为失败状态。5.根据权利要求2所述的方法,其特征在于,所述根据所述预设的评分规则以及所述当前对话状态对所述上一轮次的机器响应进行评分,得到...

【专利技术属性】
技术研发人员:岑志彬
申请(专利权)人:中国平安人寿保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1