对话数据生成方法、模型训练方法、装置、设备及介质制造方法及图纸

技术编号:37151212 阅读:8 留言:0更新日期:2023-04-06 22:07
本公开提供了一种对话数据生成方法、模型训练方法、装置、设备及介质,涉及人工智能技术领域,尤其涉及自然语言处理领域。具体实现方案为:根据对象代理的对话状态和多个预定对话流程中的目标对话流程,确定对象代理的对话动作;以及根据对象代理的对话动作,确定目标对话数据。话数据。话数据。

【技术实现步骤摘要】
对话数据生成方法、模型训练方法、装置、设备及介质


[0001]本公开涉及人工智能
,尤其涉及自然语言处理领域,更具体地,本公开提供了一种对话数据生成方法、深度学习模型的训练方法、对话数据生成装置、深度学习模型的训练装置、电子设备、存储介质以及计算机程序产品。

技术介绍

[0002]用户与系统之间可以通过对话来完成对话目标,例如完成预订餐厅、购买机票等对话目标。对话系统中的深度学习模型需要理解多轮对话信息来完成对话目标,训练该深度学习模型需要大量经过详细注释的对话数据集。然而,目前难以获得多样性丰富的对话数据集。

技术实现思路

[0003]本公开提供了一种对话数据生成方法、深度学习模型的训练方法、对话数据生成装置、深度学习模型的训练装置、电子设备、存储介质以及计算机程序产品。
[0004]根据本公开的一方面,提供了一种对话数据生成方法,包括:根据对象代理的对话状态和多个预定对话流程中的目标对话流程,确定对象代理的对话动作;以及根据对象代理的对话动作,确定目标对话数据。
[0005]根据本公开的另一方面,提供了一种深度学习模型的训练方法,包括:获取对话数据;利用对话数据训练深度学习模型;其中,对话数据是根据上述对话数据生成方法得到的。
[0006]根据本公开的另一方面,提供了一种对话数据生成装置,包括:第一确定模块和第二确定模块。第一确定模块用于根据对象代理的对话状态和多个预定对话流程中的目标对话流程,确定对象代理的对话动作;第二确定模块用于根据对象代理的对话动作,确定目标对话数据。
[0007]根据本公开的另一方面,提供了一种深度学习模型的训练装置,包括:获取模块和训练模块,获取模块用于获取对话数据;训练模块用于利用对话数据训练深度学习模型;其中,对话数据是根据上述对话数据生成装置得到的。
[0008]根据本公开的另一个方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行本公开提供的方法。
[0009]根据本公开的另一个方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行本公开提供的方法。
[0010]根据本公开的另一个方面,提供了一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现本公开提供的方法。
[0011]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0012]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0013]图1是根据本公开实施例的对话数据生成方法、深度学习模型的训练方法和装置的应用场景示意图;
[0014]图2是根据本公开实施例的对话数据生成方法的示意流程图;
[0015]图3是根据本公开实施例的对话扩充的示意原理图;
[0016]图4是根据本公开实施例的对话数据生成方法的示意原理图;
[0017]图5是根据本公开实施例的对话目标的示意原理图;
[0018]图6是根据本公开实施例的深度学习模型的训练方法的示意流程图;
[0019]图7是根据本公开实施例的对话数据生成装置的示意结构框图;
[0020]图8是根据本公开实施例的深度学习模型的训练装置的示意结构框图;以及
[0021]图9是用来实施本公开实施例的对话数据生成方法和深度学习模型的训练方法的电子设备的结构框图。
具体实施方式
[0022]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0023]在一些实施例中,可以对参考对话基于词槽和对话模板替换的方法,来获得的对话数据。例如,预先在参考对话中标注出词槽和对话模板,然后利用其它词槽值来替换参考对话中的词槽值,使用其他模板来替换参考对话中的对话模板。
[0024]需要说明的是,通过该种方式得到的对话数据的对话流程与参考对话的对话流程相同,导致对话数据的对话流程单一,无法实现对话流程的多样性拓展,然而对话数据中对话流程的多样性对于对话系统中模型的对话理解以及决策的性能至关重要。
[0025]以下将结合附图和具体实施例详细阐述本公开提供的技术方案。
[0026]图1是根据本公开实施例的对话数据生成方法、深度学习模型的训练方法和装置的应用场景示意图。
[0027]需要注意的是,图1所示仅为可以应用本公开实施例的系统架构的示例,以帮助本领域技术人员理解本公开的
技术实现思路
,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。
[0028]如图1所示,根据该实施例的系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线和/或无线通信链路等等。
[0029]用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
[0030]服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103所浏览的网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的用
户请求等数据进行分析等处理,并将处理结果(例如对话数据等)反馈给终端设备。
[0031]需要说明的是,本公开实施例所提供的对话数据生成方法和/或深度学习模型的训练方法一般可以由服务器105执行。相应地,本公开实施例所提供的对话数据生成装置和/或深度学习模型的训练装置一般可以设置于服务器105中。本公开实施例所提供的对话数据生成方法和/或深度学习模型的训练方法也可以由不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群执行。相应地,本公开实施例所提供的对话数据生成装置和/或深度学习模型的训练装置也可以设置于不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群中。
[0032]应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
[0033]图2是根据本公开实施例的对话数据生成方法的示意流程图。
[0034]如图2所示,该对话数据生成方本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种对话数据生成方法,包括:根据对象代理的对话状态和多个预定对话流程中的目标对话流程,确定所述对象代理的对话动作;以及根据所述对象代理的对话动作,确定目标对话数据。2.根据权利要求1所述的方法,其中,所述对象代理包括用户代理;所述根据对象代理的对话状态和多个预定对话流程中的目标对话流程,确定所述对象代理的对话动作包括:根据所述用户代理的对话状态,从所述多个预定对话流程中确定目标对话流程;以及根据所述用户代理的对话状态和所述目标对话流程,确定所述用户代理的对话动作。3.根据权利要求2所述的方法,其中,所述多个预定对话流程包括告知流程、询问流程和修正对话目标流程中的至少一个;其中,所述用户代理的对话状态包括针对当前接口的至少一个可告知词槽各自的填充状态,所述告知流程表征基于所述至少一个可告知词槽中处于未填充状态的词槽进行告知;所述用户代理的对话状态包括针对所述当前接口的至少一个可询问词槽各自的填充状态,所述询问流程表征基于所述至少一个可询问词槽中处于未填充状态的词槽进行询问;以及所述修正对话目标流程表征将当前对话目标修正为其他对话目标。4.根据权利要求1所述的方法,其中,所述对象代理包括系统代理,所述系统代理的对话状态包括针对当前接口的至少一个可告知词槽各自的填充状态;所述根据对象代理的对话状态和多个预定对话流程中的目标对话流程,确定所述对象代理的对话动作包括:响应于所述至少一个可告知词槽中存在填充状态是未填充的词槽且所述目标对话流程是词槽填充流程,根据处于未填充状态的可告知词槽,确定所述系统代理的对话动作。5.根据权利要求1所述的方法,其中,所述对象代理包括系统代理,所述系统代理的对话状态包括针对当前接口的至少一个可告知词槽各自的填充状态;所述根据对象代理的对话状态和多个预定对话流程中的目标对话流程,确定所述对象代理的对话动作包括:响应于所述至少一个可告知词槽各自填充状态是已填充且所述目标对话流程是答复流程,根据所述至少一个可告知词槽各自的词槽值,调用所述当前接口,以得到调用结果;以及根据所述调用结果,确定所述系统代理的对话动作。6.根据权利要求1所述的方法,其中,所述对象代理包括系统代理,所述系统代理的对话状态包括针对当前对话目标的完成状态;所述根据对象代理的对话状态和多个预定对话流程中的目标对话流程,确定所述对象代理的对话动作包括:响应于所述当前对话目标的完成状态是已完成且所述目标对话流程是新增对话流程,根据与所述当前对话目标相关的其他对话目标,确定所述系统代理的对话动作。7.根据权利要求1所述的方法,其中,所述对象代理包括用户代理和系统代理,所述方法还包括:
根据所述用户代理和所述系统代理中第一代理的对话动作,更新所述用户代理和所述系统代理中第二代理的对话状态。8.根据权利要求1所述的方法,其中,所述根据所述对象代理的对话动作,确定目标对话数据包括:根据预定模板和与所述对象代理的对话动作对应的词槽值,确定所述目标对话数据。9.根据权利要求1至8中任意一项所述的方法,还包括:根据参考对话的参考意图序列,确定目标意图序列,得到所述目标对话数据的对话目标;其中,所述目标意图序列中的每个意图对应至少一个接口,每个接口对应至少一个词槽。10.一种深度学习模型的训练方法,包括:获取对话数据;利用所述对话数据训练深度学习模型;其中,所述对话数据是根据权利要求1~9所述的方法得到的。11.一种对话数据生成装置,包括:第一确定模块,用于根据对象代理的对话状态和多个预定对话流程中的目标对话流程,确定所述对象代理的对话动作;以及第二确定模块,用于根据所述对象代理的对话动作,确定目标对话数据。12.根据权利要求11所述的装置,其中...

【专利技术属性】
技术研发人员:刘军文胡江鹭孙辉丰孙叔琦常月
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1