一种基于深度融合神经网络的中文社交文本情绪识别模型构造方法技术

技术编号:20272693 阅读:54 留言:0更新日期:2019-02-02 03:43
本发明专利技术公开了一种基于深度融合神经网络的中文社交文本情绪识别模型构造方法,包括如下步骤:数据采集,利用Python Scrapy框架构建社交文本网络爬虫,采集图文数据;数据预处理,对数据采集模块采集的中文文本进行预处理;数据标注,用于对处理后的文本进行情绪标注;文本向量化,运用Word2Vec工具训练词向量;模型构建,设计融合BILSTM‑CNN网络模型;模型训练,将标注后的文本通过BILSTM‑CNN融合神经网络模型进行训练。本发明专利技术构建一种深度融合情绪分析模型,旨在充分利用深度神经网络模型的特征抽取能力,对中文情绪文本进行特征表达,并以此构造情绪多分类模型,提高自动化情绪多分类的准确率。

【技术实现步骤摘要】
一种基于深度融合神经网络的中文社交文本情绪识别模型构造方法
本专利技术涉及自然语言处理
,具体涉及一种基于深度融合神经网络的中文社交文本情绪识别模型构造方法。
技术介绍
情绪分析属于情感分析类问题。情感分析(SA)又称为倾向性分析和意见挖掘,它是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程。情感分析可应用于电子商务,品牌声誉管理、舆情分析等众多领域。随着微博等社交媒体的普及,用户讨论自己使用的产品和服务,或表达自己的政治和宗教观点,微博网站已经成为人们评论与情感信息的宝贵来源。现在对此类数据做情感分析已经受到研究者的广泛关注。目前为止,大部分微博情感分析研究都只关注于如何对英文文本信息进行分析,并且以情感极性分析为主。现有技术中缺少更加细化的分析中文文本情绪特征,分析卷积神经网络与长短时记忆网络的特点,因此,目前亟待研究如何采用深度学习融合模型,实现较好的中文情绪分类效果。
技术实现思路
本专利技术的目的是为了解决现有技术中的上述缺陷,提供一种基于深度融合神经网络的中文社交文本情绪识别模型构造方法。本方法的特点是融合了双向长短时记忆网络与卷积神经网络的特点,使用双向长短时记忆网络完成文本的全局特征表示,再利用卷积神经网络的局部特征抽取表征文本的情绪特征,此方法在情绪分类数据集上取得了较高的准确率。本专利技术的目的可以通过采取如下技术方案达到:一种基于深度融合神经网络的中文社交文本情绪识别模型构造方法,所述的构造方法包括:数据采集步骤,用于从社交网络数据源采集中文文本数据;文本预处理步骤,处理采集到的原始文本数据;文本情绪标注步骤,对预处理后的数据进行情绪多分类标记;文本向量化步骤,通过分布式词向量表示方法Word2Vec进行中文词向量的训练;模型构建步骤,初始化模型结构,构建基于神经网络融合模型的多分类结构;模型训练步骤,训练用于多分类情绪分析的CNN-BILSTM融合网络模型,得到最终的情绪分类模型。进一步地,所述的数据采集步骤中,采用面向多主题的爬虫抓取网络情绪文本,并对其中的中文文本进行存储。进一步地,所述的文本预处理步骤过程如下:去除文本中的英文数据;去除文本中emoji和超链接,将文本中emoji替换为其简单的中文文本,将文本中超链接替换为中文“链接”;根据中文停用词典去除文本停用词。进一步地,所述的文本情绪标注步骤中,采用部分人工标注的数据和部分公开的数据,在人工标注过程中,将情绪分为喜好、恐惧、愤怒、厌恶、悲伤、高兴、惊讶七个情绪类别,各类数据各取2500条,最后将训练集和测试集分别取80%和20%的数据,所采用的函数为train_test_split,参数test_size为0.2。进一步地,所述的文本向量化步骤中,利用分布式词向量表示方法Word2Vec构建词向量模型,将输出词向量维度设置为350,其训练数据由中文维基语料与采集到的情绪语料一同作为训练样本。进一步地,所述的模型构建步骤中,构建融合模型,抽取文本情绪特征,、采用CNN(卷积神经网络)与BILSTM(双向长短时记忆网络)融合,提取情感特征。进一步地,所述的模型构建步骤中,采用Keras搭建CNN(卷积神经网络)与BILSTM(双向长短时记忆网络)融合深度神经网络,该CNN(卷积神经网络)与BILSTM(双向长短时记忆网络)融合深度神经网络结构如下:第一层是嵌入层,此层的输入为训练好的词向量序列,本专利技术将文本序列长度(词向量序列个数)设定为100,不足100的用0填充,超过100的截断。设定嵌入层采用预训练的词向量;第二层是双向LSTM层,此层输出为100*200;第三层是第一卷积层,输入的二维矩阵大小为100*200,有大小为4×4像素的32个过滤器,步长为1,激活函数设置为ReLU函数;第四层是第一池化层,采用最大池模型为MaxPooling2D,参数Poolsize为(3,3);第五层是第二卷积层,采用大小为3×3像素的32个过滤器,使用的激活函数是ReLU函数;第六层是第二池化层,采用最大池MaxPooling2D,参数poolsize为(2,2);第七层是Dropout层,参数rate设为0.3,防止过拟合;第八层是Flatten层,把多维的输入一维化;第九层是第一全连接层,输入上一神经网络层的输出展开后的向量,输出500维的向量,使用的激活函数是ReLU;第十层是第二全连接层,输入是500维的输入向量,此层为两个神经元,即输出二维数据,采用的激活函数是ReLU;第十一层是分类器Softmax层,通过Softmax分类器产生分类结果。此层输出为情绪分类的类别数为7。进一步地,所述的模型训练步骤中,在训练中文情绪文本数据集时采用的损失函数为categorical_crossentropy,优化器为adam,批量大小batch_size为100,迭代次数epoch为15。本专利技术相对于现有技术具有如下的优点及效果:1、本专利技术将预训练Word2Vec用于文本分布式词向量表示,训练数据结合了大量情绪预料以及中文维基预料,更好的表示文本的语义特性。2、本专利技术融合了双向长短时记忆网络才序列表示上的优点,以及卷积神经网络在局部特征提取上的优势,提出了一种用于中文情绪识别的深度神经网络模型。附图说明图1是本专利技术中公开的基于深度融合神经网络的中文社交文本情绪识别模型构造方法的流程示意图;图2是本专利技术中的数据采集方法逻辑图;图3是本专利技术中的用于全局特征表示的双向LSTM图;图4是本专利技术中的局部特征抽取的CNN模型结构图;图5是本专利技术中的中文情绪识别模型图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。实施例情感计算的方法主要基于词典/规则的方法以及基于统计学习/深度学习的方法,本专利技术实施例通过基于深度学习的方法进行情感分析,利用Word2Vec技术训练词向量,利用BILSTM-CNN融合网络进行情感的分析计算。深度融合情绪分析模型挖掘以及学习文本情绪表示的特点,进而深度抽取文本的情绪语义,提高情绪识别的准确率。根据附图1所示的基于深度融合神经网络的中文社交文本情绪识别模型构造方法的流程示意图,本专利技术实施例公开的基于深度融合神经网络的中文社交文本情绪识别模型构造方法包括以下步骤:数据采集步骤,用于从微博等社交网络数据源采集中文文本数据;文本预处理步骤,处理采集到的原始文本数据;文本情绪标注步骤,对预处理后的数据进行情绪多分类标记;文本向量化步骤,通过分布式词向量表示方法Word2Vec进行中文词向量的训练;模型构建步骤,初始化模型结构,构建基于神经网络融合模型的多分类结构;模型训练步骤,训练用于多分类情绪分析的CNN-BILSTM融合网络模型,得到最终的情绪分类模型。在数据采集步骤中,具体方案为使用python2.7版本下爬虫框架Scrapy,Scrapy使用了Twisted异步网络库来处理网络通讯。如附图2中的数据采集方法逻辑图,本爬虫用控制器管理爬虫本文档来自技高网...

【技术保护点】
1.一种基于深度融合神经网络的中文社交文本情绪识别模型构造方法,其特征在于,所述的构造方法包括:数据采集步骤,用于从社交网络数据源采集中文文本数据;文本预处理步骤,处理采集到的原始文本数据;文本情绪标注步骤,对预处理后的数据进行情绪多分类标记;文本向量化步骤,通过分布式词向量表示方法Word2Vec进行中文词向量的训练;模型构建步骤,初始化模型结构,构建基于神经网络融合模型的多分类结构;模型训练步骤,训练用于多分类情绪分析的CNN‑BILSTM融合网络模型,得到最终的情绪分类模型。

【技术特征摘要】
1.一种基于深度融合神经网络的中文社交文本情绪识别模型构造方法,其特征在于,所述的构造方法包括:数据采集步骤,用于从社交网络数据源采集中文文本数据;文本预处理步骤,处理采集到的原始文本数据;文本情绪标注步骤,对预处理后的数据进行情绪多分类标记;文本向量化步骤,通过分布式词向量表示方法Word2Vec进行中文词向量的训练;模型构建步骤,初始化模型结构,构建基于神经网络融合模型的多分类结构;模型训练步骤,训练用于多分类情绪分析的CNN-BILSTM融合网络模型,得到最终的情绪分类模型。2.根据权利要求1所述的一种基于深度融合神经网络的中文社交文本情绪识别模型构造方法,其特征在于,所述的数据采集步骤中,采用面向多主题的爬虫抓取网络情绪文本,并对其中的中文文本进行存储。3.根据权利要求1所述的一种基于深度融合神经网络的中文社交文本情绪识别模型构造方法,其特征在于,所述的文本预处理步骤过程如下:去除文本中的英文数据;去除文本中emoji和超链接,将文本中emoji替换为其简单的中文文本,将文本中超链接替换为中文“链接”;根据中文停用词典去除文本停用词。4.根据权利要求1所述的一种基于深度融合神经网络的中文社交文本情绪识别模型构造方法,其特征在于,所述的文本情绪标注步骤中,采用部分人工标注的数据和部分公开的数据,在人工标注过程中,将情绪分为喜好、恐惧、愤怒、厌恶、悲伤、高兴、惊讶七个情绪类别,各类数据各取2500条,最后将训练集和测试集分别取80%和20%的数据,所采用的函数为train_test_split,参数test_size为0.2。5.根据权利要求1所述的一种基于深度融合神经网络的中文社交文本情绪识别模型构造方法,其特征在于,所述的文本向量化步骤中,利用分布式词向量表示方法Word2Vec构建词向量模型,将输出词向量维度设置为350,其训练数据由中文维基语料与采集到的情绪语料一同作为训练样本。6.根据权利要求1所述的一种基于深度融合神经网络的中...

【专利技术属性】
技术研发人员:梅登华戴立武
申请(专利权)人:华南理工大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1