针对人机对话的模型训练方法及相关装置制造方法及图纸

技术编号:37245801 阅读:28 留言:0更新日期:2023-04-20 23:26
本申请提供了一种针对人机对话的模型训练方法及相关装置,包括:将多个标准语句输入第一模型,得到每个标准语句对应的至少一个第一三元组;获取参考训练数据,所述参考训练数据包括多个训练单元,每个训练单元中包括一个标准语句和所述一个标准语句对应的至少一个第一三元组;根据所述参考训练数据训练第二模型,得到训练好的第二模型,所述训练好的第二模型为所述基于人工神经网络的语义关系提取模型。可以提高针对人机对话的模型的训练效率,增强人机对话的智能性和灵活性。增强人机对话的智能性和灵活性。增强人机对话的智能性和灵活性。

【技术实现步骤摘要】
针对人机对话的模型训练方法及相关装置


[0001]本申请属于互联网产业的一般数据处理领域,具体涉及一种针对人机对话的模型训练方法及相关装置。

技术介绍

[0002]在人机对话的开发过程中,语音引擎需要去分析用户输入的语句的语义,然后根据语义再确定要输出的下一句机器语句。而当前在对基于人机对话的模型进行训练时,均需要开发人员人工输入大量的语句作为训练参数,这样不仅效率低且训练好的模型能处理的对话情景有限,使得训练好的模型在人机对话在实际应用中不够灵活智能,用户使用体验不高。

技术实现思路

[0003]本申请实施例提供了一种针对人机对话的模型训练方法及相关装置,以期提高针对人机对话的模型的训练效率,增强人机对话的智能性和灵活性。
[0004]第一方面,本申请实施例提供了一种针对人机对话的模型训练方法,包括:将多个标准语句输入第一模型,得到每个标准语句对应的至少一个第一三元组,所述第一模型为基于规则和/或语义知识网络的语义关系提取模型,三元组用于表征用户意图,包括关联关系和两个实体,每个实体中包括至少一个词语,所述关联关系用于本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种针对人机对话的模型训练方法,其特征在于,包括:将多个标准语句输入第一模型,得到每个标准语句对应的至少一个第一三元组,所述第一模型为基于规则和/或语义知识网络的语义关系提取模型,三元组用于表征用户意图,包括关联关系和两个实体,每个实体中包括至少一个词语,所述关联关系用于表征所述两个实体的语义和/或语法关系;获取参考训练数据,所述参考训练数据包括多个训练单元,每个训练单元中包括一个标准语句和所述一个标准语句对应的至少一个第一三元组;根据所述参考训练数据训练第二模型,得到训练好的第二模型,所述训练好的第二模型为基于人工神经网络的语义关系提取模型。2.根据权利要求1所述的方法,其特征在于,所述训练好的第二模型用于获取用户输入语句对应的跳转条件,所述跳转条件中包括至少一个第二三元组,所述跳转条件用于指示针对所述跳转条件对应的用户输入语句的机器响应策略。3.根据权利要求1所述的方法,所述第二模型还为预训练模型,所述方法还包括:用所述第一模型获取的所述参考训练数据中每个训练单元中的标准语句和所述一个标准语句对应的至少一个第一三元组,对第二模型进行微调训练。4.根据权利要求2或3所述的方法,其特征在于,所述根据所述参考训练数据训练第二模型,得到训练好的第二模型,包括:将当前训练单元中的标准语句输入所述第二模型,得到训练三元组;确定所述训练三元组与所述当前训练单元中的第一三元组的误差;确定所述误差是否小于预设值;若否,则根据所述误差调整所述第二模型的模型参数,并更新所述第二模型;重复上述步骤,直到所述误差小于预设值;若是,则确定下一个训练单元为所述当前训练单元;对所述参考训练数据中的所有训练单元执行上述步骤后,确定所述第二模型为训练好的第二模型。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:确定所述误差小于所述预设值的第一三元组为目标三元组;确定所述目标三元组为所述跳转条件。6.根据权利要求4所述的方法,其特征在于,所述得到训练好的第二模型之后,所述方法还包括:对所述参考训练数据中的标准语句进行归纳学习,得到至少一个归纳语句;确定所述至少一个归纳语句中的正确语句,所述正确语句对应的语义符合逻辑;将所述正确语句输入所述训练好的第二模型,得到所述正确语句对应的跳转条件。7.根据权利要求6所述的方法,其特征在于,所述得到训练好的第二模型之后,所述方法还包括:获取第一用户输入语句;将所述第一用户输入语句输入所述训练好的第二模型,得到至少一个第二备选三元组;确定是...

【专利技术属性】
技术研发人员:胡上峰
申请(专利权)人:深圳市人马互动科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1