一种基于改进生成对抗网络的情感对话生成方法技术

技术编号:36894987 阅读:14 留言:0更新日期:2023-03-15 22:23
一种基于改进生成对抗网络的情感对话生成方法属于自然语言处理下的对话系统领域,通过自注意力机制实现记忆矩阵之间的交互,增强信息间的远距离传递能量,从而提高模型的表达能力以及特征提取能力,解决现有模型存在的表达能力较弱,生成语句较短的问题。同时再设置多分类判别器,分别判别文本真假与情感类别,计算类别相对损失与情感信息损失两部分来反馈并更新生成器,用以提升情感信息的一致性,并使得回复生成语句的情感表达更加明显清晰。最后,本发明专利技术在生成器更新中使用迭代进化算法,通过分别控制温度参数与质量参数,选取进化温度最优方向的子代生成器完成生成任务。本发明专利技术实现了情感嵌入的兼顾回复质量与多样性的对话生成方法。的对话生成方法。的对话生成方法。

【技术实现步骤摘要】
一种基于改进生成对抗网络的情感对话生成方法


[0001]本专利技术属于自然语言处理下的对话系统领域,尤其涉及改进生成对抗网络的情感对话生成方法。

技术介绍

[0002]随着深度学习技术的创新和发展,人工智能领域迎来新的阶段,对话系统作为自然语言处理中的一大任务,其应用场景广泛并受到各行业高度关注。早期的对话系统针对限定领域进行具体任务的展开,此类任务需确保生成回复的逻辑准确性,而不考虑用户的情绪反馈,因此缺乏共情力。近年来,随着人机交互技术的成熟,人们开始从提高对话的语义质量转向加强对话过程的情感交互性。情感对话生成最初的研究是基于模板与规则的方式构建的,其中情感语句的使用基于模式的方式生成,设计者根据不同的场景设置不同的模板,但这种方式构建难度大不易拓展。之后神经网络模型广泛应用到生成式对话模型研究中,情感对话生成主要完成了以下任务:情感嵌入编码任务、回复情感控制任务以及情感回复解码任务,以此解决对话生成中的情感一致性,语义多样性等问题。情感一般会转化成两种维度的情绪信息,离散情绪模型是用标签的形式来表征情绪类别;维度情绪模型是将情绪映射到多维空间中,利用连续数字来描述情绪。目前存在的对话生成模型大多分为三类:基于Seq2Seq模型、基于GAN模型和基于VAE模型。
[0003]GAN模型在图像生成领域取得惊人成功,但是不能直接应用于文本生成,因为字符是离散的,生成模型的离散输出使得梯度更新难以从判别器模型传递到生成模型以指导生成器的序列生成。将GAN应用到文本生成领域是一大研究热门,相对于VAE模型在生成任务中存在的质量模糊问题,GAN在生成任务中可以提升结果的质量。研究尝试将强化学习引入GAN,将生成器建模为随机策略,通过直接执行梯度策略更新来绕开生成器的微分问题,并引入蒙特卡洛搜索保证确定下一个生成词的时候可以综合考虑当前得分和整个生成序列的得分情况。与本专利技术最接近的一项研究指定要生成的情感类型,通过设置多个生成器来生成不同情感类别的文本,然后设置多分类判别器,分别鉴别文本的真伪与情感信息的一致性,添加教师强迫机制,改善判别器的奖励无法直接有效的指导生成器生成更好的序列,从而间接导致对抗网络的训练崩塌问题,同时可以纠正情感表达的方向。
[0004]目前的情感对话生成模型还存在生成结果不稳定、缺乏多样性等问题,具体来说,现有模型的编码器解码器大多基于LSTM网络,在编码或解码过程中嵌入情感词向量,但是LSTM网络虽然增加了长距离信息传递能力,但是在传递中情感信息损失较大,会产生情感不一致问题,生成的对话内容较短,存在安全回复的几率更大。其次,现有的基于GAN的生成模型也存在对话语句多样性较差的情况,在对抗训练过程中,常出现梯度消失问题,使得每次输出相同的对话回复内容,虽然有实验证明利用条件变分编码为对话生成器的模型可以提高回复多样性,但是在提高多样性的同时也会损失语句质量,难以达到两者的平衡。
[0005]本专利技术通过改进GAN模型的生成器部分,将常用的LSTM或者记忆增强网络换为关系记忆网络,关系记忆网络设计了一种基于多头自注意力机制的关系记忆核,其基本思想
是通过自注意力机制实现记忆矩阵之间的交互,增强信息间的远距离传递能量,从而提高模型的表达能力以及特征提取能力,解决现有模型存在的表达能力较弱,生成语句较短的问题。同时再设置多分类判别器,分别判别文本真假与情感类别,计算类别相对损失与情感信息损失两部分来反馈并更新生成器,用以提升情感信息的一致性,并使得回复生成语句的情感表达更加明显清晰。最后,本专利技术在生成器更新中使用迭代进化算法,通过分别控制温度参数与质量参数,选取进化温度最优方向的子代生成器完成生成任务,平衡对话文本的多样性与文本质量之间的关系,减少现有其他模型在对抗训练中梯度消失引起的失去生成不同文本的能力的问题。通过以上改进,本专利技术在基于一个改进生成对抗网络实现了情感嵌入的兼顾回复质量与多样性的对话生成方法。

技术实现思路

[0006]针对现有技术在情感对话生成存在的部分问题,本专利技术提出了一种基于改进生成对抗网络的情感对话生成方法,该方法包括:获取带有情感标注的对话数据,将数据按照情感类型分为Angry,Disgust,Happy,Like,Sad,Other六类,下文将情感类别数定义为k类;将对话语句中的情感词向量进行语义专业化,得到带有不同情感标签的专业化对话数据;采用关系记忆网络作为生成器,并设置多判别器,分别进行语义与情感信息的反馈;通过迭代进化学习算法调节语句生成质量与多样性的平衡,生成带有指定情感类别的对话回复语句Y
c
=(y1,

,
t
,

,
T
),y
t
∈V表示回复语句的词向量,V表示候选标记的词汇表,T表示生成语句的长度,c表示指定的生成对话情感类别。
[0007]本专利技术对于改进生成对抗网络的情感对话生成模型训练过程如图1所示。
[0008]1.一种基于改进生成对抗网络的情感对话生成方法,其特征在于:获取带有情感标注的对话数据,将数据按照情感类型分为Angry,Disgust,Happy,Like,Sad,Other六类,下文将情感类别数定义为k类;将对话语句中的情感词向量进行语义专业化,得到带有不同情感标签的专业化对话数据;采用关系记忆网络作为生成器,并设置多判别器,分别进行语义与情感信息的反馈;通过迭代进化学习算法调节语句生成质量与多样性的平衡,生成带有指定情感类别的对话回复语句Y
c
=(y1,

,y
t
,

,y
T
),y
t
∈V表示回复语句的词向量,V表示候选标记的词汇表,T表示生成语句的长度,c表示指定的生成对话情感类别;
[0009]S1:首先处理数据集,进行句子粒度的情感分类;选取多条带有情感标注的标准对话数据对现有的BERT预训练模型进行处理,得到多分类情感分类器;再将获取到的用于训练的对话数据通过情感分类器进行预处理,得到每条语句对应的语义向量X={x1,x2,

,x
n
},其中x
n
表示语句中第n个词向量;通过softmax函数得到该语句属于每类情感类别的概率,为语句选定k类情感标签内概率最大的一种作为情感标记;构建情感分类器有效的减少训练成本,提升对话情感表达;
[0010]S2:将对话数据词向量进行情感专业化,进行短语粒度的情感分类;
[0011]采用卷积神经网络,包括词嵌入层、卷积池化层和分类层,词嵌入层的输入参数为词嵌入矩阵,大小为V∈n
×
d,其中n为句子长度,d为词向量的维度;卷积层的卷积核高度设置与词向量维度相同,宽度为超参数,初始设置为2;池化层采用最大池化,然后将所得的值进行拼接,分类层通过线性softmax函数得出最终的分类,完成词向量的情感专业化;
[0012]S3:构建类别感知模型,模型包括本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于改进生成对抗网络的情感对话生成方法,其特征在于:获取带有情感标注的对话数据,将数据按照情感类型分为Angry,Disgust,Happy,Like,Sad,Other六类,下文将情感类别数定义为k类;将对话语句中的情感词向量进行语义专业化,得到带有不同情感标签的专业化对话数据;采用关系记忆网络作为生成器,并设置多判别器,分别进行语义与情感信息的反馈;通过迭代进化学习算法调节语句生成质量与多样性的平衡,生成带有指定情感类别的对话回复语句Y
c
=(y1,...,y
t
,...,y
T
),y
t
∈V表示回复语句的词向量,V表示候选标记的词汇表,T表示生成语句的长度,c表示指定的生成对话情感类别;S1:首先处理数据集,进行句子粒度的情感分类;选取多条带有情感标注的标准对话数据对现有的BERT预训练模型进行处理,得到多分类情感分类器;再将获取到的用于训练的对话数据通过情感分类器进行预处理,得到每条语句对应的语义向量X={x1,x2,...,x
n
},其中x
n
表示语句中第n个词向量;通过softmax函数得到该语句属于每类情感类别的概率,为语句选定k类情感标签内概率最大的一种作为情感标记;构建情感分类器有效的减少训练成本,提升对话情感表达;S2:将对话数据词向量进行情感专业化,进行短语粒度的情感分类;采用卷积神经网络,包括词嵌入层、卷积池化层和分类层,词嵌入层的输入参数为词嵌入矩阵,大小为V∈n
×
d,其中n为句子长度,d为词向量的维度;卷积层的卷积核高度设置与词向量维度相同,宽度为超参数,初始设置为2;池化层采用最大池化,然后将所得的值进行拼接,分类层通过线性softmax函数得出最终的分类,完成词向量的情感专业化;S3:构建类别感知模型,模型包括生成器G
θ
与判别器D
c
,c∈{1,...,k},其中D
c
表示生成对话在k类情感中属于第c种情感类别的概率,D
k+1
代表文本为真实文本的概率;对于给定时刻t的新语义向量yt,用嵌入标签表示;同时对于指定情感c构建嵌入类别标签E
c
来控制情感类别信息;然后对和E
c
的串联进行线性变化W
x
,得到生成器的输入向量其中[;]表示按行连接;类别感知模型通过设定一个相对情感类别目标,根据鉴别器对情感类别的损失反馈来更新生成器;采用多分类判别器;使用sigmoid函数进行情感类别与文本真假的相对类别目标判断,再使用softmax函数单独进行k类情感的相似性判别,加强情感对话的表达;鉴别器从指定类别c的实际数据分布中随机采样从该类别的生成数据分布中随机采样并计算了总类别损失,通过在所有实际类别信息中进行随机采样并在所有生成的类别信息中随机采样以下为相对类别目标鉴别器判断公式:上式右侧第一项测量了每个类别的实际数据和生成数据之间的相对距离,第二项测量了所有类别的实际数据与生成数据之间的相对距离;其中该式表示生成对抗网络的博弈过程,式中表示从真实数据分布P
r
采样Y
r
的期望,其中Y
r
根据相对类别目标鉴别器判断公式带入数据的不同,表示真实数据中指定类别c
或所有类别all的采样和和表示从生成数据分布P
θ
采样Y
θ
的期望,Y
θ
同样根据相对类别目标鉴别器判断公式带入数据的不同,表示生成数据中指定类别c或所有类别a11的采样和和表示生成对抗网络鉴别器在输入真实或生成数据时的相对判别衡量目标,定义如下:其中Y根据式中相应的输入表示真实数据采样Y
r
或生成数据采样Y
θ
,D
k+1
(Y)表示鉴别器输入文本Y是真实文本的概率,与定义与上述公式相同;情感增强判别器部分使用多分类交叉熵损失函数,完整的鉴别器目标函数公式为:上式为相对类别目标鉴别器判断公式,第二项为情感增强判别目标,为指定情感标签c的真实文本分布,Y
s
表示在分布中的随机采样,D
c
(Y
s
)表示鉴别器对输入Y
s
判别是第c类情感的概率,此项通过softmax函数进一步判断所生成对话情感符合指定情感类别,为生成器提供反馈信息;S4:采用关系记忆网络作为生成器,生成过程中,将逐步更新记忆矩阵,并结合前面步骤的输出,具体表示为将前一时刻的记忆矩阵M
t
与处理好的词向量x
t
作为输入,记忆矩阵M
t
的每一行代表一个记忆槽,使用自注意力的方式...

【专利技术属性】
技术研发人员:蔺茜鄂新华霍如
申请(专利权)人:北京工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1