针对人机对话的模型训练方法及相关装置制造方法及图纸

技术编号:37245801 阅读:20 留言:0更新日期:2023-04-20 23:26
本申请提供了一种针对人机对话的模型训练方法及相关装置,包括:将多个标准语句输入第一模型,得到每个标准语句对应的至少一个第一三元组;获取参考训练数据,所述参考训练数据包括多个训练单元,每个训练单元中包括一个标准语句和所述一个标准语句对应的至少一个第一三元组;根据所述参考训练数据训练第二模型,得到训练好的第二模型,所述训练好的第二模型为所述基于人工神经网络的语义关系提取模型。可以提高针对人机对话的模型的训练效率,增强人机对话的智能性和灵活性。增强人机对话的智能性和灵活性。增强人机对话的智能性和灵活性。

【技术实现步骤摘要】
针对人机对话的模型训练方法及相关装置


[0001]本申请属于互联网产业的一般数据处理领域,具体涉及一种针对人机对话的模型训练方法及相关装置。

技术介绍

[0002]在人机对话的开发过程中,语音引擎需要去分析用户输入的语句的语义,然后根据语义再确定要输出的下一句机器语句。而当前在对基于人机对话的模型进行训练时,均需要开发人员人工输入大量的语句作为训练参数,这样不仅效率低且训练好的模型能处理的对话情景有限,使得训练好的模型在人机对话在实际应用中不够灵活智能,用户使用体验不高。

技术实现思路

[0003]本申请实施例提供了一种针对人机对话的模型训练方法及相关装置,以期提高针对人机对话的模型的训练效率,增强人机对话的智能性和灵活性。
[0004]第一方面,本申请实施例提供了一种针对人机对话的模型训练方法,包括:将多个标准语句输入第一模型,得到每个标准语句对应的至少一个第一三元组,所述第一模型为基于规则和/或语义知识网络的语义关系提取模型,三元组用于表征用户意图,包括关联关系和两个实体,每个实体中包括至少一个词语,所述关联关系用于表征所述两个实体的语义和/或语法关系;获取参考训练数据,所述参考训练数据包括多个训练单元,每个训练单元中包括一个标准语句和所述一个标准语句对应的至少一个第一三元组;根据所述参考训练数据训练第二模型,得到训练好的第二模型,所述训练好的第二模型为基于人工神经网络的语义关系提取模型。
[0005]第二方面,本申请实施例提供了一种针对人机对话的模型训练装置,包括:输入单元,用于将多个标准语句输入第一模型,得到每个标准语句对应的至少一个第一三元组,所述第一模型为基于规则和/或语义知识网络的语义关系提取模型,三元组用于表征用户意图,包括关联关系和两个实体,每个实体中包括至少一个词语,所述关联关系用于表征所述两个实体的语义和/或语法关系;获取单元,用于获取参考训练数据,所述参考训练数据包括多个训练单元,每个训练单元中包括一个标准语句和所述一个标准语句对应的至少一个第一三元组;训练单元,用于根据所述参考训练数据训练第二模型,得到训练好的第二模型,所述训练好的第二模型为基于人工神经网络的语义关系提取模型。
[0006]第三方面,本申请实施例提供了一种电子设备,包括处理器、存储器、通信接口,以及一个或多个程序,所述一个或多个程序被存储在所述存储器中,并且被配置由所述处理器执行,所述程序包括用于执行本申请实施例第一方面中的步骤的指令。
[0007]第四方面,本申请实施例提供了一种计算机存储介质,其特征在于,存储用于电子
数据交换的计算机程序,其中,所述计算机程序使得计算机执行如本实施例第一方面中所描述的部分或全部步骤。
[0008]第五方面,本申请实施例提供了一种计算机程序产品,其中,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。
[0009]可见,本申请实施例中,先将多个标准语句输入第一模型,得到每个标准语句对应的至少一个第一三元组,然后获取参考训练数据,所述参考训练数据包括多个训练单元,每个训练单元中包括一个标准语句和所述一个标准语句对应的至少一个第一三元组,最后根据所述参考训练数据训练第二模型,得到训练好的第二模型,所述训练好的第二模型为基于人工神经网络的语义关系提取模型。这样可以提高针对人机对话的模型的训练效率,增强人机对话时的智能性和灵活性,提高用户对话体验。
附图说明
[0010]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0011]图1是本申请实施例提供的一种人机对话系统的结构示意图;图2是本申请实施例提供的一种电子设备的结构示意图;图3是本申请实施例提供的一种针对人机对话的模型训练方法的流程示意图;图4是本申请实施例提供的一种人机话剧本的示意图;图5是本申请实施例提供的一种针对人机对话的模型训练装置的功能单元组成框图;图6是本申请实施例提供的另一种针对人机对话的模型训练装置的功能单元组成框图。
具体实施方式
[0012]为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0013]本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
[0014]在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同
的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
[0015]当前在对基于人机对话的模型进行训练时,均需要开发人员人工输入大量的语句作为训练参数,这样不仅效率低且训练好的模型能处理的对话情景有限,使得训练好的模型在人机对话在实际应用中不够灵活智能,用户使用体验不高。
[0016]针对上述问题,本申请实施例提供了一种针对人机对话的模型训练方法及相关装置,下面结合附图对本申请实施例进行详细介绍。
[0017]请参阅图1,图1是本申请实施例提供的一种人机对话系统的结构示意图。如图1所示,所述人机对话系统10包括电子设备101和人机对话引擎102,电子设备101和人机对话引擎102通信连接。该电子设备101中包括针对人机对话的模型训练装置,用于训练第二模型,并生成每个剧情节点对应的人机对话的跳转条件,并将创建好的跳转条件发送给人机对话引擎102,使得人机对话引擎102可以获取用户输入语句,并根据该输入语句获取文本信息,然后对该文本信息进行语义识别,然后将获取的语义识别结果与当前剧情节点的跳转条件集合中的跳转条件进行匹配,并跳转到对应剧情节点,执行机器响应策略,以输出剧情语句,完成和用户的交流。
[0018]请参阅图2,图2是本申请实施例提供的一种电子设备的结构示意图。如图2所示,所述电子设备101包括处理器120、存储器130、通信接口140以及一个或多个程序131,其中,所述一个或多个程序本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种针对人机对话的模型训练方法,其特征在于,包括:将多个标准语句输入第一模型,得到每个标准语句对应的至少一个第一三元组,所述第一模型为基于规则和/或语义知识网络的语义关系提取模型,三元组用于表征用户意图,包括关联关系和两个实体,每个实体中包括至少一个词语,所述关联关系用于表征所述两个实体的语义和/或语法关系;获取参考训练数据,所述参考训练数据包括多个训练单元,每个训练单元中包括一个标准语句和所述一个标准语句对应的至少一个第一三元组;根据所述参考训练数据训练第二模型,得到训练好的第二模型,所述训练好的第二模型为基于人工神经网络的语义关系提取模型。2.根据权利要求1所述的方法,其特征在于,所述训练好的第二模型用于获取用户输入语句对应的跳转条件,所述跳转条件中包括至少一个第二三元组,所述跳转条件用于指示针对所述跳转条件对应的用户输入语句的机器响应策略。3.根据权利要求1所述的方法,所述第二模型还为预训练模型,所述方法还包括:用所述第一模型获取的所述参考训练数据中每个训练单元中的标准语句和所述一个标准语句对应的至少一个第一三元组,对第二模型进行微调训练。4.根据权利要求2或3所述的方法,其特征在于,所述根据所述参考训练数据训练第二模型,得到训练好的第二模型,包括:将当前训练单元中的标准语句输入所述第二模型,得到训练三元组;确定所述训练三元组与所述当前训练单元中的第一三元组的误差;确定所述误差是否小于预设值;若否,则根据所述误差调整所述第二模型的模型参数,并更新所述第二模型;重复上述步骤,直到所述误差小于预设值;若是,则确定下一个训练单元为所述当前训练单元;对所述参考训练数据中的所有训练单元执行上述步骤后,确定所述第二模型为训练好的第二模型。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:确定所述误差小于所述预设值的第一三元组为目标三元组;确定所述目标三元组为所述跳转条件。6.根据权利要求4所述的方法,其特征在于,所述得到训练好的第二模型之后,所述方法还包括:对所述参考训练数据中的标准语句进行归纳学习,得到至少一个归纳语句;确定所述至少一个归纳语句中的正确语句,所述正确语句对应的语义符合逻辑;将所述正确语句输入所述训练好的第二模型,得到所述正确语句对应的跳转条件。7.根据权利要求6所述的方法,其特征在于,所述得到训练好的第二模型之后,所述方法还包括:获取第一用户输入语句;将所述第一用户输入语句输入所述训练好的第二模型,得到至少一个第二备选三元组;确定是...

【专利技术属性】
技术研发人员:胡上峰
申请(专利权)人:深圳市人马互动科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1