一种基于双通道模型的文本情感分析方法技术

技术编号：20272718 阅读：273 留言：0更新日期：2019-02-02 03:44

本发明专利技术针对目前单通道神经网络模型结构单一，无法充分提取文本信息的问题，提出一种基于双通道模型的文本情感分析方法。包括步骤：首先使用Word2Vec训练词向量，将文本表示成词向量矩阵的形式；然后将其作为输入数据，分别送入卷积神经网络(CNN)和长短时记忆(LSTM)网络中进行特征提取；并在其后引入注意力模型，提取文本重要特征信息；最后将两个通道所提取的文本特征进行合并，利用分类层进行情感分类。本发明专利技术所提方法具有可行性和优越性，其性能明显优于其他单通道神经网络模型。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于双通道模型的文本情感分析方法
本专利技术提出一种基于双通道模型的文本情感分析方法，涉及文本情感分析领域。
技术介绍
近年来，随着互联网产业的快速发展，出现了众多新兴媒体，这些新媒体不断地冲击和改变着人们的生活方式。各种电商平台的崛起，使得足不出户的网络购物变得简单也流行，而这种购物方式得到的唯一反馈就是消费者所留下的消费体验评论，这些真实的评论是决定潜在消费者是否消费的唯一依据。因此对这些大量带有感情色彩的文本进行情感分析，是对电商平台或者消费者群体都有益的工作。文本情感分析的主要任务就是对带有感情色彩的文本信息进行分析，提取特征，并做出极性判断。目前文本情感分析的方法主要有两种，基于情感词典的方法和基于机器学习的方法。其中基于情感字典的方法通过对文本中的情感词进行一定方式的组合计算，最终得到文本的情感极性。但是随着社会的发展，该方法在面对日益多元化的文本时，效果就不够理想。另外，使用机器学习方法进行文本情感分析，需要大量人工设计的数据特征，随着要处理的文本数据集的增加，传统机器学习方法已经无法又快又好的学习文本的深层信息特征。在使用传统方法在进行文本信息特征提取的时候，都是对文本进行无差别的特征提取，但是值得注意的是文本中每个词语对整个文本情感极性的贡献是不同的，常用的神经网络，如卷积神经网络(ConvolutionalNeuralNetwork,CNN)和长短时记忆网络(LongShort-TermMemory,LSTM)，提取特征时无法分辨句子中重要信息的位置，从而导致文本分类结果受无关信息的影响很大。现有的情感分析方法基本都是通过构建单通道...

【技术保护点】
1.一种基于双通道模型的文本情感分析方法，其特征在于，所述文本情感分析方法包括以下步骤:步骤1、对数据集进行预处理，使用Word2Vec训练词向量，将文本表示成词向量矩阵的形式；步骤2、将训练好的词向量矩阵作为CNN的输入特征，并进行卷积操作，学习文本局部特征，并在其后接入注意力层；步骤3、将训练好的词向量矩阵作为LSTM网络的输入，学习文本的序列信息，并使用注意力机制学习重要文本信息；步骤4、将两个通道提取到的文本特征合并，输入Softmax分类层进行分类，通过与文本原有标签对比计算，得出文本分类正确率。

【技术特征摘要】
1.一种基于双通道模型的文本情感分析方法，其特征在于，所述文本情感分析方法包括以下步骤:步骤1、对数据集进行预处理，使用Word2Vec训练词向量，将文本表示成词向量矩阵的形式；步骤2、将训练好的词向量矩阵作为CNN的输入特征，并进行卷积操作，学习文本局部特征，并在其后接入注意力层；步骤3、将训练好的词向量矩阵作为LSTM网络的输入，学习文本的序列信息，并使用注意力机制学习重要文本信息；步骤4、将两个通道提取到的文本特征合并，输入Softmax分类层进行分类，通过与文本原有标签对比计算，得出文本分类正确率。2.根据权利要求1所述的一种基于双通道模型的文本情感分析方法，其特征在于，步骤1中，对数据集进行预处理，并使用Word2Vec训练词向量，将文本表示成词向量矩阵的形式；包括如下步骤：步骤11、对文本进行预处理，利用结巴分词工具对语料进行分词处理，并过滤掉停用词；步骤12、使用Word2Vec将预处理过的语料训练为固定维度词向量，格式如下：，其中,d代表词向量维度，取值128；步骤13、将词向量按照顺序拼接成为固定大小的词向量矩阵。3.根据权利要求1所述的一种基于双通道模型的文本情感分析方法，其特征在于，在步骤2中，将训练好的词向量矩阵作为CNN的输入特征，并进行卷积操作，学习文本局部特征，并在其后接入注意力层；包括如下步骤：步骤21、通过在输入矩阵上使用线性滤波器的方式执行卷积操作，可以表示如下：上式中为偏置项，为高度为=3，4，5，宽度为=128的卷积核，为非线性激活函数，采用ReLu函数作为激活函数,表示为下式：步骤22、卷积操作完成后，得到一张特征图C：上式中，分号表示对卷积操作产生的特征进行拼接;步骤23、使...

【专利技术属性】
技术研发人员：李辉，高娜，刘小磊，周巧喜，徐坚，李金秋，
申请(专利权)人：河南理工大学，
类型：发明
国别省市：河南,41

全部详细技术资料下载我是这个专利的主人