一种对话生成模型的训练以及对话生成方法、装置及设备制造方法及图纸

技术编号：34543533 阅读：15 留言：0更新日期：2022-08-13 21:40

本发明专利技术公开了一种对话生成模型的训练以及对话生成方法、装置及设备，涉及数据处理技术领域，其中，所述对话生成模型的训练方法包括：获取第一对话集与第二对话集，其中，所述第一对话集中的每组对话包括话术及该话术的回话话术，每组对话中的话术包括对话触发标签，每组对话中的回话话术包括回话标签，所述第二对话集中的对话不带有标签；根据所述第一对话集，预测所述第二对话集中的每组对话对应的标签，得到第三对话集；将所述第一对话集与所述第三对话集作为训练样本训练待训练对话生成模型，以得到对话生成模型。通过上述方式，本发明专利技术提高了对话生成模型的对话效果。明提高了对话生成模型的对话效果。明提高了对话生成模型的对话效果。

全部详细技术资料下载

【技术实现步骤摘要】
一种对话生成模型的训练以及对话生成方法、装置及设备

[0001]本专利技术涉及数据处理
，具体涉及一种对话生成模型的训练以及对话生成方法、装置及设备。

技术介绍

[0002]在对话生成模型的研究和使用过程中，加入对话标签可以有效的提高模型生成结果的可解释性和模型行为的可控性。这里，对话标签是指用于制定对话生成的规则。
[0003]目前常见的对话生成方法是，在得到当前话术后，首先通过训练标签分类器来对当前话术的下一步动作进行预测，得到下一步动作的标签，然后将该标签与当前话术以及历史对话数据输入对话生成模型进行语句生成当前话术的回话话术。但这种对话生成方法中，涉及的策略模型和对话生成模型在训练时，分别使用两套独立的训练样本，会导致对话生成模型结合标签的效果差；另一方面，训练样本中的话术和回话话术需要人工标注标签，如果数据量少会导致对话生成模型结合策略的效果更差，会存在误差累加。
[0004]基于此，如何提供一种对话生成模型的训练方法来提高对话生成模型的对话效果是本领域人员亟待解决的问题。

技术实现思路

[0005]为解决上述问题，提出了本专利技术实施例的对话生成模型的训练方法、装置及设备。
[0006]根据本专利技术实施例的一个方面，提供了一种对话生成模型的训练方法，包括：获取第一对话集与第二对话集，其中，所述第一对话集中的每组对话包括话术及该话术的回话话术，每组对话中的话术包括对话触发标签，每组对话中的回话话术包括回话标签，所述第二对话集中的对话不带有标签；根据所述第一对话...

【技术保护点】

【技术特征摘要】
1.一种对话生成模型的训练方法，其特征在于，所述方法包括：获取第一对话集与第二对话集，其中，所述第一对话集中的每组对话包括话术及该话术的回话话术，每组对话中的话术包括对话触发标签，每组对话中的回话话术包括回话标签，所述第二对话集中的对话不带有标签；根据所述第一对话集，预测所述第二对话集中的每组对话对应的标签，得到第三对话集；将所述第一对话集与所述第三对话集作为训练样本训练待训练对话生成模型，以得到对话生成模型。2.根据权利要求1所述的对话生成模型的训练方法，其特征在于，所述第二对话集中的对话数量大于所述第一对话集中的对话数量。3.根据权利要求1所述的对话生成模型的训练方法，其特征在于，根据所述第一对话集，预测所述第二对话集中的每组对话对应的标签，得到第三对话集，包括：使用所述第一对话集训练待训练的策略分类器，得到策略分类器；调用所述策略分类器根据所述第一对话集为所述第二对话集中每组对话添加标签，以得到所述第三对话集。4.根据权利要求1所述的对话生成模型的训练方法，其特征在于，在得到第三对话集之后，还包括：使用所述训练样本训练待训练的标签预测模型，得到标签预测模型，其中，所述标签预测模型用于接收触发标签，并在接收触发标签后预测对应的回话标签。5.根据权利要求1所述的对话生成模型的训练方法，其特征在于，将所述第一对话集与所述第三对话集作为训练样本训练待训练对话生成模型，以得到对话生成模型，包括：将所述训练样本中所有标签为对话触发标签的话术作为触发话术集，将所述训练样本中所有标签为回话标签的回话话术以及每个回话话术对应的回话标签作为回话话术集；使用所述触发话术集以及所述回话话术集训练待训练对话生成模型，得到所述对话生成模型。6.一种对话生成方法，其特征在于，所述方法包括：获取第一对话数据，所述第一对话数据包括历史对话以及待回话话术；调用标签预测模型根据所述历史对话对所述待回话话术的回话标签进行预测，得到第一回话标签，所述标签预测模型是根据权利要求1
‑<...

【专利技术属性】
技术研发人员：彭立彪，郑银河，黄民烈，
申请(专利权)人：北京聆心智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人