一种对话生成模型的训练以及对话生成方法、装置及设备制造方法及图纸

技术编号:34543533 阅读:15 留言:0更新日期:2022-08-13 21:40
本发明专利技术公开了一种对话生成模型的训练以及对话生成方法、装置及设备,涉及数据处理技术领域,其中,所述对话生成模型的训练方法包括:获取第一对话集与第二对话集,其中,所述第一对话集中的每组对话包括话术及该话术的回话话术,每组对话中的话术包括对话触发标签,每组对话中的回话话术包括回话标签,所述第二对话集中的对话不带有标签;根据所述第一对话集,预测所述第二对话集中的每组对话对应的标签,得到第三对话集;将所述第一对话集与所述第三对话集作为训练样本训练待训练对话生成模型,以得到对话生成模型。通过上述方式,本发明专利技术提高了对话生成模型的对话效果。明提高了对话生成模型的对话效果。明提高了对话生成模型的对话效果。

【技术实现步骤摘要】
一种对话生成模型的训练以及对话生成方法、装置及设备


[0001]本专利技术涉及数据处理
,具体涉及一种对话生成模型的训练以及对话生成方法、装置及设备。

技术介绍

[0002]在对话生成模型的研究和使用过程中,加入对话标签可以有效的提高模型生成结果的可解释性和模型行为的可控性。这里,对话标签是指用于制定对话生成的规则。
[0003]目前常见的对话生成方法是,在得到当前话术后,首先通过训练标签分类器来对当前话术的下一步动作进行预测,得到下一步动作的标签,然后将该标签与当前话术以及历史对话数据输入对话生成模型进行语句生成当前话术的回话话术。但这种对话生成方法中,涉及的策略模型和对话生成模型在训练时,分别使用两套独立的训练样本,会导致对话生成模型结合标签的效果差;另一方面,训练样本中的话术和回话话术需要人工标注标签,如果数据量少会导致对话生成模型结合策略的效果更差,会存在误差累加。
[0004]基于此,如何提供一种对话生成模型的训练方法来提高对话生成模型的对话效果是本领域人员亟待解决的问题。

技术实现思路

[0005]为解决上述问题,提出了本专利技术实施例的对话生成模型的训练方法、装置及设备。
[0006]根据本专利技术实施例的一个方面,提供了一种对话生成模型的训练方法,包括:获取第一对话集与第二对话集,其中,所述第一对话集中的每组对话包括话术及该话术的回话话术,每组对话中的话术包括对话触发标签,每组对话中的回话话术包括回话标签,所述第二对话集中的对话不带有标签;根据所述第一对话集,预测所述第二对话集中的每组对话对应的标签,得到第三对话集;将所述第一对话集与所述第三对话集作为训练样本训练待训练对话生成模型,以得到对话生成模型。
[0007]可选的,所述第二对话集中的对话数量大于所述第一对话集中的对话数量。
[0008]可选的,根据所述第一对话集,预测所述第二对话集中的每组对话对应的标签,得到第三对话集,包括:使用所述第一对话集训练待训练的策略分类器,得到策略分类器;调用所述策略分类器根据所述第一对话集为所述第二对话集中每组对话添加标签,以得到所述第三对话集。
[0009]可选的,在得到第三对话集之后,还包括:使用所述训练样本训练待训练的标签预测模型,得到所述标签预测模型,其中,所述标签预测模型用于接收触发标签,并在接收触发标签后预测对应的回话标签。
[0010]可选的,将所述第一对话集与所述第三对话集作为训练样本训练待训练对话生成
模型,以得到对话生成模型,包括:将所述训练样本中所有标签为对话触发标签的话术作为触发话术集,将所述训练样本中所有标签为回话标签的回话话术以及每个回话话术对应的回话标签作为回话话术集;使用所述触发话术集以及所述回话话术集训练待训练对话生成模型,得到所述对话生成模型。
[0011]根据本专利技术实施例的另一个方面,提供了一种对话生成方法,包括:获取第一对话数据,所述第一对话数据包括历史对话以及待回话话术;调用标签预测模型根据所述历史对话对所述待回话话术的回话标签进行预测,得到第一回话标签,所述标签预测模型是根据权利要求1

5中任一方法训练得到的;调用对话生成模型根据第一回话标签生成第一回话数据,得到第一回话。
[0012]根据本专利技术实施例的另一个方面,提供了一种对话生成模型的训练装置,包括:第一获取模块,用于获取第一对话集与第二对话集,其中,所述第一对话集中的每组对话包括话术及该话术的回话话术,每组对话中的话术包括对话触发标签,每组对话中的回话话术包括回话标签,所述第二对话集中的对话不带有标签;处理模块,用于根据所述第一对话集,预测所述第二对话集中的每组对话对应的标签,得到第三对话集;训练模块,用于将所述第一对话集与所述第三对话集作为训练样本训练待训练对话生成模型,以得到对话生成模型,所述对话生成模型是根据上述任一方法训练得到的。
[0013]根据本专利技术实施例的另一个方面,提供了一种对话生成装置,包括:第二获取模块,用于获取第一对话数据,所述第一对话数据包括历史对话以及待回话话术;调用模块,用于调用标签预测模型根据所述历史对话对所述待回话话术的回话标签进行预测,得到第一回话标签,所述标签预测模型是根据上述任一方法训练得到的;生成模块,用于调用对话生成模型根据第一回话标签生成第一回话数据,得到第一回话,所述对话生成模型是根据上述任一方法训练得到的。
[0014]根据本专利技术实施例的又一方面,提供了一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行上述对话生成模型的训练以及对话生成方法对应的操作。
[0015]根据本专利技术实施例的再一方面,提供了一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如上述对话生成模型的训练以及对话生成方法对应的操作。
[0016]根据本专利技术上述实施例提供的方案,通过获取第一对话集与第二对话集,其中,所述第一对话集中的每组对话包括话术及该话术的回话话术,每组对话中的话术包括对话触发标签,每组对话中的回话话术包括回话标签,所述第二对话集中的对话不带有标签;根据所述第一对话集,预测所述第二对话集中的每组对话对应的标签,得到第三对话集;将所述第一对话集与所述第三对话集作为训练样本训练待训练对话生成模型,以得到对话生成模
型,提高了对话生成模型的对话效果。
[0017]上述说明仅是本专利技术实施例技术方案的概述,为了能够更清楚了解本专利技术实施例的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术实施例的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术实施例的具体实施方式。
附图说明
[0018]通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术实施例的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1示出了本专利技术实施例提供的对话生成模型的训练方法流程图;图2示出了本专利技术实施例提供的对话生成方法流程图;图3示出了本专利技术实施例提供的一种具体的策略对话生成模型训练过程示意图;图4示出了本专利技术实施例提供的一种具体的策略对话模型生成过程示意图;图5示出了本专利技术实施例提供的对话生成模型的训练装置的结构示意图;图6示出了本专利技术实施例提供的对话生成装置的结构示意图;图7示出了本专利技术实施例提供的计算设备的结构示意图。
具体实施方式
[0019]下面将参照附图更详细地描述本专利技术的示例性实施例。虽然附图中显示了本专利技术的示例性实施例,然而应当理解,可以以各种形式实现本专利技术而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本专利技术,并且能够将本专利技术的范围完整的传达给本领域的技术人员。
[0020]图1示出了本专利技术实施例提供的对话生成模型的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种对话生成模型的训练方法,其特征在于,所述方法包括:获取第一对话集与第二对话集,其中,所述第一对话集中的每组对话包括话术及该话术的回话话术,每组对话中的话术包括对话触发标签,每组对话中的回话话术包括回话标签,所述第二对话集中的对话不带有标签;根据所述第一对话集,预测所述第二对话集中的每组对话对应的标签,得到第三对话集;将所述第一对话集与所述第三对话集作为训练样本训练待训练对话生成模型,以得到对话生成模型。2.根据权利要求1所述的对话生成模型的训练方法,其特征在于,所述第二对话集中的对话数量大于所述第一对话集中的对话数量。3.根据权利要求1所述的对话生成模型的训练方法,其特征在于,根据所述第一对话集,预测所述第二对话集中的每组对话对应的标签,得到第三对话集,包括:使用所述第一对话集训练待训练的策略分类器,得到策略分类器;调用所述策略分类器根据所述第一对话集为所述第二对话集中每组对话添加标签,以得到所述第三对话集。4.根据权利要求1所述的对话生成模型的训练方法,其特征在于,在得到第三对话集之后,还包括:使用所述训练样本训练待训练的标签预测模型,得到标签预测模型,其中,所述标签预测模型用于接收触发标签,并在接收触发标签后预测对应的回话标签。5.根据权利要求1所述的对话生成模型的训练方法,其特征在于,将所述第一对话集与所述第三对话集作为训练样本训练待训练对话生成模型,以得到对话生成模型,包括:将所述训练样本中所有标签为对话触发标签的话术作为触发话术集,将所述训练样本中所有标签为回话标签的回话话术以及每个回话话术对应的回话标签作为回话话术集;使用所述触发话术集以及所述回话话术集训练待训练对话生成模型,得到所述对话生成模型。6.一种对话生成方法,其特征在于,所述方法包括:获取第一对话数据,所述第一对话数据包括历史对话以及待回话话术;调用标签预测模型根据所述历史对话对所述待回话话术的回话标签进行预测,得到第一回话标签,所述标签预测模型是根据权利要求1
‑<...

【专利技术属性】
技术研发人员:彭立彪郑银河黄民烈
申请(专利权)人:北京聆心智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1