一种对话生成模型损失参数的确定方法和装置制造方法及图纸

技术编号：35644111 阅读：10 留言：0更新日期：2022-11-19 16:36

本申请提供了一种对话生成模型损失参数的确定方法和装置，所述方法包括：所述方法包括：通过对话数据的标注样本训练对话生成模型，得到所述对话生成模型的整体损失参数；通过所述标注样本进行虚拟对抗训练，得到虚拟对抗损失参数；根据所述整体损失参数和所述虚拟对抗损失参数的和值，得到所述对话生成模型的最终损失参数。本申请能够增强对话生成模型的泛化能力和准确性。泛化能力和准确性。泛化能力和准确性。

全部详细技术资料下载

【技术实现步骤摘要】
一种对话生成模型损失参数的确定方法和装置

[0001]本申请涉及自然语言处理
，尤其涉及一种对话生成模型损失参数的确定方法和装置。

技术介绍

[0002]对话生成是自然语言处理、信息抽取的一项子任务，其在智能问答、多轮对话、人机交互、智能客服等领域扮演者重要角色。
[0003]目前对话生成方法主要为生成模型，应用自然语言处理的算法，利用编码器
‑
解码器结构进行回复。生成模型更接近人对话的过程，能自动从已有对话文本中学习如何生成文本，灵活性高。
[0004]但生成模型往往存在着鲁棒性、泛化性不强的问题，加入传统的对抗训练(如FGM、PGD等)，虽然可以增强鲁棒性，但同时会损害模型的泛化性，造成模型泛化性差。

技术实现思路

[0005]本申请实施例的目的在于提供一种对话生成模型损失参数的确定方法和装置，以解决生成对话准确度不够高的问题。具体技术方案如下：
[0006]第一方面，提供了一种对话生成模型损失参数的确定方法，所述方法包括：
[0007]通过对话数据的标注样本训练对话生成模型，得到所述对话生成模型的整体损失参数；
[0008]通过所述标注样本进行虚拟对抗训练，得到虚拟对抗损失参数；
[0009]根据所述整体损失参数和所述虚拟对抗损失参数的和值，得到所述对话生成模型的最终损失参数。
[0010]可选地，通过对话数据的标注样本训练对话生成模型，得到所述对话生成模型的整体损失参数包括：
[0011]对所述对话数据进行...

【技术保护点】

【技术特征摘要】
1.一种对话生成模型损失参数的确定方法，其特征在于，所述方法包括：通过对话数据的标注样本训练对话生成模型，得到所述对话生成模型的整体损失参数；通过所述标注样本进行虚拟对抗训练，得到虚拟对抗损失参数；根据所述整体损失参数和所述虚拟对抗损失参数的和值，得到所述对话生成模型的最终损失参数。2.根据权利要求1所述的方法，其特征在于，通过对话数据的标注样本训练对话生成模型，得到所述对话生成模型的整体损失参数包括：对所述对话数据进行词性标注和句法标注，得到标注样本，其中，所述对话数据包括属于不同对话对象的第一语句和第二语句；将所述第一语句输入对话生成模型，得到所述对话生成模型输出的预测结果，其中，所述预测结果包括预测的第二语句的内容、词性和句法；将所述预测结果和所述第二语句进行对比，得到所述对话生成模型关于对话生成任务的第一损失参数、关于词性预测任务的第二损失参数以及关于句法预测任务的第三损失参数；根据所述第一损失参数、所述第二损失参数和所述第三损失参数得到所述整体损失参数。3.根据权利要求2所述的方法，其特征在于，对所述对话数据进行词性标注和句法标注包括：通过分词工具对所述对话数据进行分词；采用词性识别方案对所述分词进行词性标注；采用句法识别方案对所述分词进行句法标注，其中，所述句法标注指示所述分词在所述对话数据中的语句成分或语句关系。4.根据权利要求2所述的方法，其特征在于，得到所述对话生成模型关于对话生成任务的第一损失参数、关于词性预测任务的第二损失参数以及关于句法预测任务的第三损失参数包括：通过所述对话生成模型的解码器隐状态层获取关于对话生成任务的第一损失参数，其中，所述对话生成模型采用编码器
‑
解码器结构；通过所述对话生成模型的解码器共享层获取关于词性预测任务的第二损失参数；通过所述对话生成模...

【专利技术属性】
技术研发人员：彭旋，陈自岩，高鑫，
申请(专利权)人：中译语通科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人