一种基于深度学习的情感文本生成方法技术

技术编号:26172229 阅读:32 留言:0更新日期:2020-10-31 13:48
本发明专利技术公开了一种基于深度学习的情感文本生成方法,将变分自编码器和辅助分类器生成对抗网络有效地结合在一起,通过变分自编码器的数据特征挖掘以及潜在空间表示的优异性能进行情感文本生成任务,并在其中添加了注意力机制,而辅助分类器生成对抗网络的判别器则设计了一种利用词频‑逆文档频率、情感注意力融合特征向量加权计算的多特征卷积神经网络与深度双向门控循环单元组成的模型进行数据判别,并在其基础上增加了集成学习模块来提供生成器额外的情感分类损失惩罚。本发明专利技术生成的情感文本一定程度上接近真实的情感文本,不仅可用于文本分析的数据增强工作,也可使人机对话生成更加感性化的内容,提高结果精确率的同时也可提升执行效率。

An emotional text generation method based on deep learning

【技术实现步骤摘要】
一种基于深度学习的情感文本生成方法
本专利技术属于自然语言处理领域中,具体涉及一种基于深度学习的情感文本生成方法。
技术介绍
伴随着互联网不断前进的脚步,信息化社会阶段已经逐渐从满足人们的基本要求发展至利用智能化技术提供给人们更加便利化生活的阶段。现如今,无论是电商平台中智能化的导购小助手,还是金融领域中人性化的服务机器人,人机对话模式越来越受到用户群体的关注。通过产生更加感性化的对话内容来获得用户认可甚至信任是情感文本生成技术的应用方向之一。同时,情感文本生成技术的前提是学习文本数据的真实结构与情感特征,以往文本数据的情感特征仅仅是基于情感词典的方式进行无监督式学习,后来发展为以统计学为基础的机器学习。但情感文本数据常常由于人工标注的经验性误差导致其训练数据集出现不平衡情况,因此情感文本生成技术通过生成指定情感类别的文本数据成为有效解决情感数据不平衡问题的数据增强技术之一。
技术实现思路
专利技术目的:本专利技术旨在提出一种基于深度学习的情感文本生成方法,利用深度学习的相关模型对真实情感文本相关句法结构和情感特征信本文档来自技高网...

【技术保护点】
1.一种基于深度学习的情感文本生成方法,其特征在于,包括以下步骤:/n(1)重构情感文本的词向量特征表示和字向量特征表示:将真实情感文本的词向量表示和字向量表示分别输入至编码器部分的双向长短时记忆网络中进行计算,计算出近似标准正态分布的后验分布潜在变量,将潜在变量、前一时刻的隐藏层状态和输出、情感标签向量以及当前时刻结合注意力机制得到的注意力分配权重共同输入至解码器部分的双向长短时记忆网络中进行计算,通过词向量重构表示和字向量重构表示得到真实情感文本的重构情感文本特征表示;/n(2)真实情感文本和重构情感文本的真伪判定以及二者的情感判定:首先将真实情感文本和重构情感文本的词特征向量、字特征向量...

【技术特征摘要】
1.一种基于深度学习的情感文本生成方法,其特征在于,包括以下步骤:
(1)重构情感文本的词向量特征表示和字向量特征表示:将真实情感文本的词向量表示和字向量表示分别输入至编码器部分的双向长短时记忆网络中进行计算,计算出近似标准正态分布的后验分布潜在变量,将潜在变量、前一时刻的隐藏层状态和输出、情感标签向量以及当前时刻结合注意力机制得到的注意力分配权重共同输入至解码器部分的双向长短时记忆网络中进行计算,通过词向量重构表示和字向量重构表示得到真实情感文本的重构情感文本特征表示;
(2)真实情感文本和重构情感文本的真伪判定以及二者的情感判定:首先将真实情感文本和重构情感文本的词特征向量、字特征向量分别输入至深度双向门控循环单元中进行语义特征提取;再将特征向量分别与文本的词语级TF-IDF、情感注意力融合特征向量以及字符级TF-IDF、情感注意力融合特征向量进行权重计算得到的加权特征向量同时输入至多特征卷积神经网络中进行文本真伪和情感类别判定;同时将词向量表示输入至基于Stacking算法的集成情感分类模型中进行情感类别判定,最终分别得到真实情感文本和重构情感文本的真伪性、情感倾向性判定结果;
(3)对重构部分和判定部分的进行训练,获取情感文本生成模型;
(4)生成多样化的情感文本:训练完成后,将从近似后验分布潜在变量中进行循环随机采样得到的样本数据与指定的情感标签向量进行结合后输入至解码器中生成对应情感标签的情感文本。


2.根据权利要求1所述的一种基于深度学习的情感文本生成方法,其特征在于,所述步骤(1)包括以下步骤:
(11)将真实情感文本分别通过中文领域基于转换器模型的双向编码表示和词向量转换两种预训练模型计算得到的文本词特征向量和字特征向量表示输入至编码器部分的双向长短时记忆网络中进行计算,得到每个时刻下的隐藏层状态输出以及最终的语义编码向量输出;
(12)根据编码器输出的隐藏层状态H对其每个时刻取最大值处理得到Hx后,可利用神经网络计算出其均值和对数方差,并采用重参数化的技巧对其进行转换后,将转换后的潜在变量和情感标签向量输入至解码器部分的双向长短时记忆网络结构中,并结合注意力机制进行序列的输出,输出第k个时刻隐藏层状态sk为:sk=BiLSTM(Z,sk-1,yk-1,ck,C),其中Z表示潜在变...

【专利技术属性】
技术研发人员:张迎周刘磊陈宏建傅建清肖雁冰黄秋月
申请(专利权)人:南京邮电大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1