一种对话数据扩展方法、装置及设备制造方法及图纸

技术编号:35043811 阅读:17 留言:0更新日期:2022-09-24 23:23
本申请实施例涉及人工智能领域,公开了一种对话数据扩展方法、装置及设备。本申请实施例涉及对话数据扩展方法包括:获取对话语料库;拆分对话语料库,得到第一角色训练集以及第二角色训练集;分别依据第一角色训练集以及第二角色训练集对第一对话模型以及第二对话模型进行训练,得到第一角色以及第二角色对话模型;将第一角色对话模型与所述第二角色对话模型进行对话,得到目标对话数据集。可见,将完整的对话信息作为训练样本,得到每个角色可用于生成目标对话数据集的对话模型,并汇总最后的目标数据集作为训练样本数据,实现对话数据的扩展。这样,保证了最终得到的训练样本在对话过程中上下文逻辑的连贯性。话过程中上下文逻辑的连贯性。话过程中上下文逻辑的连贯性。

【技术实现步骤摘要】
一种对话数据扩展方法、装置及设备


[0001]本专利技术实施例涉及人工智能领域,尤其涉及一种对话数据扩展方法、装置及设备。

技术介绍

[0002]对话模型,常被应用于为用户提供聊天交流服务的对话系统中。对话模型为用户提供聊天交流服务通常包括:对等型聊天以及非对等型聊天。所谓对等型聊天,通常是指对话模型与用户在对话过程中没有严格的上下文逻辑连贯要求,主要用于为用户提供闲聊消遣服务;非对等型聊天,通常是指对话模型与用户在对话过程中具有明确的身份限定,并且具有较为严格的上下文逻辑连贯要求,例如:在咨询场景中的提问者与解答者针对某一项问题进行咨询的过程。
[0003]为了使对话模型能够为用户提供更好的服务,需要提前完成对话模型的训练。相对于其它类型的模型训练,对话模型需要大量对话数据作为训练样本,然而对于训练样本的获取难度和成本较高,为了得到充足的对话模型所用的训练样本,需要对已有的训练样本进行数据扩展,以得到更多的对话数据用于对话模型的训练。现阶段对于对话模型所用的训练样本的数据扩展方式通常为词替换法。但是,基于词替换法进行的数据扩展得到的对话模型训练样本,由于存在关键词被替换的现象,使得训练样本之间的上下文逻辑连贯性较低,用此训练样本训练得到的模型,无法适用于应用在非对等型聊天场景。

技术实现思路

[0004]本申请实施例提供了一种对话数据扩展方法、装置及设备,以解决现有对话数据扩展方法中由于关键词被替换导致训练样本之间上下文逻辑连贯较低的问题。
[0005]第一方面,本申请实施例提供了一种对话数据扩展方法,所述方法包括:获取对话语料库,所述对话语料库包括:至少一组第一角色与第二角色的对话信息,所述第一角色与所述第二角色为非对等型聊天关系;对所述对话语料库进行拆分,得到第一角色训练集以及第二角色训练集;依据所述第一角色训练集对第一对话模型进行训练,得到第一角色对话模型;依据所述第二角色训练集对第二对话模型进行训练,得到第二角色对话模型;调用所述第一角色对话模型与所述第二角色对话模型进行对话场景训练,得到目标对话数据集,以实现数据扩展。
[0006]在一些可能的实施方式中,所述对话语料库由所述第一角色与所述第二角色的历史对话记录得到。这样,以此拆分得到的所述第一角色训练集以及所述第二角色训练集中的数据更接近实际场景,使所述第一角色对话模型以及所述第二角色对话训练模型最终的收敛结果更准确。
[0007]在一些可能的实施方式中,所述至少一组第一角色与第二角色的对话信息中的每一个,包括:第一角色对应的语境信息、第二角色对应的语境信息、第一角色应答信息以及第二角色应答信息。
[0008]具体的,所述第一角色对应的语境信息由所述第一角色发出,所述第二角色对应的语境信息由所述第二角色发出,所述第一角色应答信息为所述第一角色响应于所述第二角色对应的语境信息发出的应答信息,所述第二角色应答信息为所述第二角色响应于所述第一角色对应的语境信息发出的应答信息。
[0009]在一些可能的实施方式中,所述至少一组第一角色与第二角色的对话信息中的每一个,还包括:话题类别以及情绪类别,每个第一角色与第二角色的对话信息对应一个话题类别以及一个情绪类别。这样,通过对不同话题类别以及不同情绪类别对应的对话信息进行分类,以使所述第一角色对话模型以及所述第二角色对话模型基于不同话题类别以及不同情绪类别生成目标对话数据集。
[0010]在一些可能的实施方式中,所述第一角色训练集包括:至少一组第一角色对话训练信息,第一角色对话训练信息包括:所述第一角色响应于所述第二角色对应的语境信息输出的第一角色应答信息;所述第二角色训练集包括:至少一组第二角色对话训练信息,第二角色对话训练信息包括:所述第二角色响应于所述第一角色对应的语境信息输出的第二角色应答信息。这样,可以使第一角色对话模型以及第二角色对话模型的训练目的性更强,进而提高所述目标对话数据集的上下文逻辑连贯性。
[0011]在一些可能的实施方式中,所述目标对话数据集,包括:至少一组所述第一角色对话模型与所述第二角色对话模型的对话信息。
[0012]在一些可能的实施方式中,所述将所述第一角色对话模型与所述第二角色对话模型进行对话,包括:为所述第一角色对话模型或所述第二角色对话模型设定至少一个话题类别。这样,可以使经过所述第一角色对话模型以及所述第二角色对话模型得到的对话数据集中的对话数据适用于更多的应用场景,使数据扩展范围更大。
[0013]在一些可能的实施方式中,所述对话语料库还可以由预先设置的编码模型根据预设规则得到,所述预先设置的文本编码模型,种类包括以下至少一种:卷积神经网络模型,循环神经网络模型,Transformer模型以及预训练BERT模型。
[0014]第二方面,本申请实施例还提供了一种对话数据扩展装置,所述装置包括:获取模块,用于获取对话语料库,所述对话语料库包括:至少一组第一角色与第二角色的对话信息,所述第一角色与第二角色为非对等型聊天关系;拆分模块,用于对所述对话语料库进行拆分,得到第一角色训练集以及第二角色训练集;第一训练模块,用于依据所述第一角色训练集对第一对话模型进行训练,得到第一角色对话模型;第二训练模块,用于依据所述第二角色训练集对第二对话模型进行训练,得到第二角色对话模型;执行模块,用于调用所述第一角色对话模型与所述第二角色对话模型进行对话场景训练,得到目标对话数据集,以实现数据扩展。
[0015]第三方面,本申请实施例还提供了一种电子设备,所诉电子设备包括:存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令执行第一方面或第一方面任一可能的实施方式中的方法。
[0016]第四方面,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行第一方面或第一方面任一可能的实施方式中的方法。
[0017]本申请实施例提供了一种对话数据扩展方法,本方案中,首先,获取对话语料库,所述对话语料库包括:至少一组第一角色与第二角色的对话信息,所述第一角色与第二角色为非对等型聊天关系;然后,对所述对话语料库进行拆分,得到第一角色训练集以及第二角色训练集;接着,依据所述第一角色训练集对第一对话模型进行训练,得到第一角色对话模型;依据所述第二角色训练集对第二对话模型进行训练,得到第二角色对话模型;最后,调用所述第一角色对话模型与所述第二角色对话模型进行对话场景训练,得到目标对话数据集,以实现数据扩展。可见,将完整的对话信息代替替换关键词作为训练样本,分别输入每个对话角色对应的学习模型中进行单独训练,并将训练好的两个对话模型进行实际对话应用,并汇总对话内容作为最后的目标数据集,实现对话数据的扩展。这样,保证了最终得到的对话数据作为的训练样本在对话过程中上下文逻辑的连贯性,进而使应用此训练样本的对话模型在对话过程中上下文逻辑的连贯性更好,更适用于非对等型聊天场景。
附图说明
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种对话数据扩展方法,其特征在于,所述方法包括:获取对话语料库,所述对话语料库包括:至少一组第一角色与第二角色的对话信息,所述第一角色与所述第二角色为非对等型聊天关系;对所述对话语料库进行拆分,得到第一角色训练集以及第二角色训练集;依据所述第一角色训练集对第一对话模型进行训练,得到第一角色对话模型;依据所述第二角色训练集对第二对话模型进行训练,得到第二角色对话模型;调用所述第一角色对话模型与所述第二角色对话模型进行对话场景训练,得到目标对话数据集,以实现数据扩展。2.如权利要求1所述的方法,其特征在于,所述对话语料库由所述第一角色与所述第二角色的历史对话记录得到。3.如权利要求1所述的方法,其特征在于,所述至少一组第一角色与第二角色的对话信息中的每一个,包括:第一角色对应的语境信息、第二角色对应的语境信息、第一角色应答信息以及第二角色应答信息。4.如权利要求1所述的方法,其特征在于,所述至少一组第一角色与第二角色的对话信息中的每一个,还包括:话题类别以及情绪类别,每个第一角色与第二角色的对话信息对应一个话题类别以及一个情绪类别。5.如权利要求1或3所述的方法,其特征在于,所述第一角色训练集包括:至少一组第一角色对话训练信息,第一角色对话训练信息包括:所述第一角色响应于所述第二角色对应的语境信息输出的第一角色应答信息;所述第二角色训练集包括:至少一组第二角色对话训练信息,第二角色对话训练信息包括:所述第二角色响应于所述第一角色对应的语境信息输出的第二角色应答信息。...

【专利技术属性】
技术研发人员:彭立彪郑银河黄民烈
申请(专利权)人:北京聆心智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1