基于终身蒸馏的开放域对话生成方法及设备技术

技术编号：35901808 阅读：8 留言：0更新日期：2022-12-10 10:38

本发明专利技术提供了一种基于终身蒸馏的开放域对话生成方法及设备。所述方法包括：步骤1至步骤3。本发明专利技术提出由浅入深依次顺序建模不同层次的对话数据，保证每种对话层次特征能够被准确建模，能够有效提升模型的准确性，采用旧层次对话训练的模型当作教师，在建模新层次对话时蒸馏该教师的知识给学生，学生能够综合建模各种对话特征，有利于保持对话的多样性。有利于保持对话的多样性。有利于保持对话的多样性。

全部详细技术资料下载

【技术实现步骤摘要】
基于终身蒸馏的开放域对话生成方法及设备

[0001]本专利技术实施例涉及开放域对话生成
，尤其涉及一种基于终身蒸馏的开放域对话生成方法及设备。

技术介绍

[0002]随着信息技术和互联网的迅猛发展，社交媒体日渐普及，智能手机数量剧增，人机对话场景越来越多，对话系统扮演的角色越来越重要。开放域对话系统是对话系统的一个重要分支，能够生成不限领域的日常对话。当前的开放域对话产生方法存在容易生成单调对话回应的问题，一些方法希望通过提高生成回应多样性的方式缓解该问题，但这些模型生成的回应仍然与真实回应存在一定差距。此外，一味提高生成回应多样性能会引导模型生成与当前对话无关的词语，使回应变得冗长且奇怪，回应准确性的表现难以控制，导致回应变得无意义，与对话系统的初始目的相悖。因此，开发一种基于终身蒸馏的开放域对话生成方法及设备，可以有效克服上述相关技术中的缺陷，就成为业界亟待解决的技术问题。

技术实现思路

[0003]针对现有技术存在的上述问题，本专利技术实施例提供了一种基于终身蒸馏的开放域对话生成方法及设备。
[0004]第一方面，本专利技术的实施例提供了一种基于终身蒸馏的开放域对话生成方法，包括：步骤1：对原始数据进行预处理，得到验证集、测试集、以及包含历史话语数量不超过3个多段对话的训练集；步骤2：构建基于终身蒸馏的开放域对话生成模型，将训练样本与验证样本批量随机地输入基于终身蒸馏的开放域对话生成模型中，开始迭代模型训练过程，得到训练集与验证集上的评价指标，当验证集上的指标不再上升或迭代达到预定...

【技术保护点】

【技术特征摘要】
1.一种基于终身蒸馏的开放域对话生成方法，其特征在于，包括：步骤1：对原始数据进行预处理，得到验证集、测试集、以及包含历史话语数量不超过3个多段对话的训练集；步骤2：构建基于终身蒸馏的开放域对话生成模型，将训练样本与验证样本批量随机地输入基于终身蒸馏的开放域对话生成模型中，开始迭代模型训练过程，得到训练集与验证集上的评价指标，当验证集上的指标不再上升或迭代达到预定次数后停止，保存验证集上的最优模型，所述构建基于终身蒸馏的开放域对话生成模型包括：构建基础编解码模型结构、构建基于终身蒸馏的教师
‑
学生架构、构建目标函数；步骤3：加载在验证集上评价指标最优的基于终身蒸馏的开放域对话生成模型，采用测试样本批量进行测试，输出与保存对话生成的结果。2.根据权利要求1所述的基于终身蒸馏的开放域对话生成方法，其特征在于，步骤1中的原始数据包含多轮对话数据，并将训练集的每段对话处理成对话历史话语数量不超过3个的多段对话。3.根据权利要求2所述的基于终身蒸馏的开放域对话生成方法，其特征在于，步骤2中的构建基础编解码模型结构具体为：采用基于Transformer的序列到序列生成框架，构建嵌入层、编码器、解码器及输出层。4.根据权利要求3所述的基于终身蒸馏的开放域对话生成方法，其特征在于，步骤2中构建基于终身蒸馏的教师
‑
学生架构具体为：在构建模型时引入旧模型作为教师帮助蒸馏之前层次的对话知识，将上一时刻训练好的模型Mm
‑
1当作当前时刻m训练模型Mm的教师，到下一时刻m+1，当前模型Mm作为教师指导模型Mm+1的训练，以此类推进行顺序蒸馏。5.根据权利要求4所述的基于终身蒸馏的开放域对话生成方法，其特征在于，步骤2中构建目标函数具体为：为在当前训练过程中，能够保存部分之前训练过程中学习到的知识，让模型能够学习不同轮次对话的特征，提高模型的准确性和多样性，在每个样例除硬标签与预测分布之间的损失之外，引入上一个过程训练好的模型，将其作为教师模型，输出的软标签指导当前模型进行预测...

【专利技术属性】
技术研发人员：钱铁云，姜聪聪，徐马一，
申请(专利权)人：武汉大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人