一种基于改进生成对抗网络的情感对话生成方法技术

技术编号：36894987 阅读：14 留言：0更新日期：2023-03-15 22:23

一种基于改进生成对抗网络的情感对话生成方法属于自然语言处理下的对话系统领域，通过自注意力机制实现记忆矩阵之间的交互，增强信息间的远距离传递能量，从而提高模型的表达能力以及特征提取能力，解决现有模型存在的表达能力较弱，生成语句较短的问题。同时再设置多分类判别器，分别判别文本真假与情感类别，计算类别相对损失与情感信息损失两部分来反馈并更新生成器，用以提升情感信息的一致性，并使得回复生成语句的情感表达更加明显清晰。最后，本发明专利技术在生成器更新中使用迭代进化算法，通过分别控制温度参数与质量参数，选取进化温度最优方向的子代生成器完成生成任务。本发明专利技术实现了情感嵌入的兼顾回复质量与多样性的对话生成方法。的对话生成方法。的对话生成方法。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于改进生成对抗网络的情感对话生成方法

[0001]本专利技术属于自然语言处理下的对话系统领域，尤其涉及改进生成对抗网络的情感对话生成方法。

技术介绍

[0002]随着深度学习技术的创新和发展，人工智能领域迎来新的阶段，对话系统作为自然语言处理中的一大任务，其应用场景广泛并受到各行业高度关注。早期的对话系统针对限定领域进行具体任务的展开，此类任务需确保生成回复的逻辑准确性，而不考虑用户的情绪反馈，因此缺乏共情力。近年来，随着人机交互技术的成熟，人们开始从提高对话的语义质量转向加强对话过程的情感交互性。情感对话生成最初的研究是基于模板与规则的方式构建的，其中情感语句的使用基于模式的方式生成，设计者根据不同的场景设置不同的模板，但这种方式构建难度大不易拓展。之后神经网络模型广泛应用到生成式对话模型研究中，情感对话生成主要完成了以下任务：情感嵌入编码任务、回复情感控制任务以及情感回复解码任务，以此解决对话生成中的情感一致性，语义多样性等问题。情感一般会转化成两种维度的情绪信息，离散情绪模型是用标签的形式来表征情绪类别；维度情绪模型是将情绪映射到多维空间中，利用连续数字来描述情绪。目前存在的对话生成模型大多分为三类：基于Seq2Seq模型、基于GAN模型和基于VAE模型。
[0003]GAN模型在图像生成领域取得惊人成功，但是不能直接应用于文本生成，因为字符是离散的，生成模型的离散输出使得梯度更新难以从判别器模型传递到生成模型以指导生成器的序列生成。将GAN应用到文本生成领域是一大研究热门，相对于VAE模型在生成...

【技术保护点】

【技术特征摘要】
1.一种基于改进生成对抗网络的情感对话生成方法，其特征在于：获取带有情感标注的对话数据，将数据按照情感类型分为Angry，Disgust，Happy，Like，Sad，Other六类，下文将情感类别数定义为k类；将对话语句中的情感词向量进行语义专业化，得到带有不同情感标签的专业化对话数据；采用关系记忆网络作为生成器，并设置多判别器，分别进行语义与情感信息的反馈；通过迭代进化学习算法调节语句生成质量与多样性的平衡，生成带有指定情感类别的对话回复语句Y
c
＝(y1，...，y
t
，...，y
T
)，y
t
∈V表示回复语句的词向量，V表示候选标记的词汇表，T表示生成语句的长度，c表示指定的生成对话情感类别；S1：首先处理数据集，进行句子粒度的情感分类；选取多条带有情感标注的标准对话数据对现有的BERT预训练模型进行处理，得到多分类情感分类器；再将获取到的用于训练的对话数据通过情感分类器进行预处理，得到每条语句对应的语义向量X＝{x1，x2，...，x
n
}，其中x
n
表示语句中第n个词向量；通过softmax函数得到该语句属于每类情感类别的概率，为语句选定k类情感标签内概率最大的一种作为情感标记；构建情感分类器有效的减少训练成本，提升对话情感表达；S2：将对话数据词向量进行情感专业化，进行短语粒度的情感分类；采用卷积神经网络，包括词嵌入层、卷积池化层和分类层，词嵌入层的输入参数为词嵌入矩阵，大小为V∈n
×
d，其中n为句子长度，d为词向量的维度；卷积层的卷积核高度设置与词向量维度相同，宽度为超参数，初始设置为2；池化层采用最大池化，然后将所得的值进行拼接，分类层通过线性softmax函数得出最终的分类，完成词向量的情感专业化；S3：构建类别感知模型，模型包括生成器G
θ
与判别器D
c
，c∈{1，...，k}，其中D
c
表示生成对话在k类情感中属于第c种情感类别的概率，D
k+1
代表文本为真实文本的概率；对于给定时刻t的新语义向量yt，用嵌入标签表示；同时对于指定情感c构建嵌入类别标签E
c
来控制情感类别信息；然后对和E
c
的串联进行线性变化W
x
，得到生成器的输入向量其中[；]表示按行连接；类别感知模型通过设定一个相对情感类别目标，根据鉴别器对情感类别的损失反馈来更新生成器；采用多分类判别器；使用sigmoid函数进行情感类别与文本真假的相对类别目标判断，再使用softmax函数单独进行k类情感的相似性判别，加强情感对话的表达；鉴别器从指定类别c的实际数据分布中随机采样从该类别的生成数据分布中随机采样并计算了总类别损失，通过在所有实际类别信息中进行随机采样并在所有生成的类别信息中随机采样以下为相对类别目标鉴别器判断公式：上式右侧第一项测量了每个类别的实际数据和生成数据之间的相对距离，第二项测量了所有类别的实际数据与生成数据之间的相对距离；其中该式表示生成对抗网络的博弈过程，式中表示从真实数据分布P
r
采样Y
r
的期望，其中Y
r
根据相对类别目标鉴别器判断公式带入数据的不同，表示真实数据中指定类别c
或所有类别all的采样和和表示从生成数据分布P
θ
采样Y
θ
的期望，Y
θ
同样根据相对类别目标鉴别器判断公式带入数据的不同，表示生成数据中指定类别c或所有类别a11的采样和和表示生成对抗网络鉴别器在输入真实或生成数据时的相对判别衡量目标，定义如下：其中Y根据式中相应的输入表示真实数据采样Y
r
或生成数据采样Y
θ
，D
k+1
(Y)表示鉴别器输入文本Y是真实文本的概率，与定义与上述公式相同；情感增强判别器部分使用多分类交叉熵损失函数，完整的鉴别器目标函数公式为：上式为相对类别目标鉴别器判断公式，第二项为情感增强判别目标，为指定情感标签c的真实文本分布，Y
s
表示在分布中的随机采样，D
c
(Y
s
)表示鉴别器对输入Y
s
判别是第c类情感的概率，此项通过softmax函数进一步判断所生成对话情感符合指定情感类别，为生成器提供反馈信息；S4：采用关系记忆网络作为生成器，生成过程中，将逐步更新记忆矩阵，并结合前面步骤的输出，具体表示为将前一时刻的记忆矩阵M
t
与处理好的词向量x
t
作为输入，记忆矩阵M
t
的每一行代表一个记忆槽，使用自注意力的方式...

【专利技术属性】
技术研发人员：蔺茜，鄂新华，霍如，
申请(专利权)人：北京工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人