一种基于可控多空间特征解耦的开放域对话生成方法技术

技术编号：39182168 阅读：8 留言：0更新日期：2023-10-27 08:29

本发明专利技术属于开放域聊天技术领域，具体涉及一种基于可控多空间特征解耦的开放域对话生成方法；M

全部详细技术资料下载

【技术实现步骤摘要】
一种基于可控多空间特征解耦的开放域对话生成方法

[0001]本专利技术属于开放域聊天
，具体涉及一种基于可控多空间特征解耦的开放域对话生成方法。

技术介绍

[0002]随着深度学习的快速崛起，对话系统也得到了迅速的发展。学术研究中将对话系统分为任务型对话系统和非任务型对话系统。任务型对话系统一般是pipeline模式的多模块模型，这种模式被广泛应用，并且具有很强的可解释性，即对话生成的过程清晰，逻辑性强。非任务型对话系统也叫开放领域对话系统，一般是端到端的生成模型。端到端模型与多模块模型相比，能够减少网络的复杂度，并且避免了多模块模型中不同模块训练目标不一致的缺陷。端到端模型一般由编码器和解码器组成，其通过编码器将对话上文编码为固定的向量，然后解码这个特征向量来生成对话下文。这样纯数据驱动训练的方法是黑盒模型，对话生成的逻辑难以让人理解，也无法让人预测生成的下文，缺乏可解释性。并且模型将文本编码为固定向量会导致相同的输入生成相同的回复，然而这种回复的单一性限制了基于开放领域的对话生成。为了解决这种单一性问题，需要增加对话生成的多样性，这也有利于提高人机交互的积极性，同时对于开放领域对话系统的发展非常重要。
[0003]对话的可解释性，多样性和可控性是对话系统中几个需要解决的关键问题。如果能够控制对话生成，可以提高生成质量。深度潜变量模型十分适合开放领域的对话系统。深度潜变量模型中最具代表性的就是变分自编码器(VAEs)和条件变分自编码器(CVAEs)。相比于变分自编码器的输入只有对话的上文，条件变分自编...

【技术保护点】

【技术特征摘要】
1.一种基于可控多空间特征解耦的开放域对话生成方法，其特征在于，包括：将问题文本输入到训练好的M
‑
CVAE模型中，生成对应的回复文本；M
‑
CVAE模型包括编码器、识别网络、先验网络、解码器、分类器和可控语义生成器；M
‑
CVAE模型的训练过程分为预训练阶段、训练阶段和测试阶段；其中，预训练过程具体包括：S1：获取问题文本序列和回复文本序列并将其嵌入到词空间中，得到问题词向量和回复词向量；S2：将问题词向量输入到输入编码器，得到问题文本特征表示；将回复词向量输入到输出编码器，得到回复文本特征表示；S3：将问题文本特征表示和回复文本特征表示输入到识别网络以及先验网络中进行计算，得到隐变量；S4：将隐变量作为解码器的初始隐状态并将参考回复输入到解码器中进行处理，生成回复文本；S5：将问题文本特征表示输入到分类器中，得到问题分类类别概率；S6：计算模型总损失并根据总损失调整模型参数，得到预训练好的M
‑
CVAE模型。2.根据权利要求1所述的一种基于可控多空间特征解耦的开放域对话生成方法，其特征在于，所述输入编码器和输出编码器均为双向LSTM。3.根据权利要求1所述的一种基于可控多空间特征解耦的开放域对话生成方法，其特征在于，得到隐变量的过程包括：将问题文本特征表示和回复文本特征表示输入到识别网络中计算得到近似后验分布隐空间的分布参数μ和σ；从后验分布隐空间采样并使用重参数化操作，得到隐变量，表示为：...

【专利技术属性】
技术研发人员：王烨，廖靖波，于洪，黄昌豪，杨峻杰，卞政轩，
申请(专利权)人：重庆邮电大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人