基于组合模型的文本情感分析方法、系统、装置制造方法及图纸

技术编号:22055312 阅读:38 留言:0更新日期:2019-09-07 15:16
本发明专利技术属于模式识别技术领域,具体涉及了一种基于组合模型的文本情感分析方法、系统、装置,旨在解决无法有效结合文本的双向序列和结构化信息,文本情感分析不够全面、准确的问题。本发明专利技术方法包括:采用词向量词典对文本查表,获得文本每个词的词向量;对词的位置信息进行编码,并与相应词向量相加,获得文本的句子表示;采用双向编码表示器,提取文本的深度双向特征表示;采用多核卷积神经网络提取文本的深度双向特征表示的句子结构信息;对文本的句子结构信息分类得到待判断情感文本的情感类别。本发明专利技术能够有效的提取文本的双向序列特性以及结构特征,能够对文本情感进行更为全面的分析,并且网络可以并行训练,能够大大缩减训练时间。

Text Emotion Analysis Method, System and Device Based on Combination Model

【技术实现步骤摘要】
基于组合模型的文本情感分析方法、系统、装置
本专利技术属于模式识别
,具体涉及了一种基于组合模型的文本情感分析方法、系统、装置。
技术介绍
很多文本都包含了情感信息,不管是电子商品评价、电影评论、酒店评价等等,越来越多的消费者在购买产品或享受服务的时候会对产品或服务的评价信息进行参考。商家也会对这些评价进行分析,判断这些评价是不是可以吸引顾客,分析哪些方面还存在不足,发现潜在的问题然后进行改进。由于评价数据的数据量往往十分巨大,人工分析将会花费大量的人力物力。利用机器学习方法可以更高效率的进行文本情感分析。深度神经网络(DNN,DeepNeuralNetwork)由于不需要手工构建特征并且其结果好,已经成为情感分析中广泛使用的方法。文本情感分析中的深度神经网络主要涉及卷积神经网络(CNN,ConvolutionalNeuralNetwork)和循环神经网络(RNN,RecurrentNeuralNetwork)两种框架。文本是结构化和有组织的,基于卷积神经网络的算法可以有效地挖掘文本中的结构化信息,从而提高分类的准确性。不管对情感分析有用的特征出现在句子中的什么位置,卷积神经网本文档来自技高网...

【技术保护点】
1.一种基于组合模型的文本情感分析方法,其特征在于,该文本情感分析方法包括:步骤S10,采用词向量词典对获取的待判断情感文本进行查表,获得待判断情感文本每个词的词向量;步骤S20,对每个词的位置信息进行编码,将编码得到的每个词的位置表示与相应词的词向量相加,获得待判断情感文本的句子表示;步骤S30,采用双向编码表示器,依据所述待判断情感文本的句子表示,获得待判断情感文本的深度双向特征表示;步骤S40,采用多核卷积神经网络提取所述待判断情感文本的深度双向特征表示的句子结构信息;步骤S50,使用softmax分类函数对所述待判断情感文本的句子结构信息进行分类,获得待判断情感文本的情感类别。

【技术特征摘要】
1.一种基于组合模型的文本情感分析方法,其特征在于,该文本情感分析方法包括:步骤S10,采用词向量词典对获取的待判断情感文本进行查表,获得待判断情感文本每个词的词向量;步骤S20,对每个词的位置信息进行编码,将编码得到的每个词的位置表示与相应词的词向量相加,获得待判断情感文本的句子表示;步骤S30,采用双向编码表示器,依据所述待判断情感文本的句子表示,获得待判断情感文本的深度双向特征表示;步骤S40,采用多核卷积神经网络提取所述待判断情感文本的深度双向特征表示的句子结构信息;步骤S50,使用softmax分类函数对所述待判断情感文本的句子结构信息进行分类,获得待判断情感文本的情感类别。2.根据权利要求1所述的基于组合模型的文本情感分析方法,其特征在于,步骤S10中“采用词向量词典对获取的待判断情感文本进行查表,获得待判断情感文本每个词的词向量”,其方法为:vi=oiWem其中,vi代表词向量,i代表词向量对应的词在句子中的位置;oi为1×N维度的one-hot向量,表示词向量对应的词在词典中的位置,N为词向量词典中所有词的个数;Wem为N×d维度的矩阵代表词向量词典,d为句子的长度。3.根据权利要求1所述的基于组合模型的文本情感分析方法,其特征在于,步骤S20中“对每个词的位置信息进行编码”,其方法为:pi=|pi,1pi,2pi,3…pi,2jpi,2j+1…pi,d|其中,pi代表第i个词的位置编码;pi,2j为pi的第2j个元素,d为句子的长度。4.根据权利要求1所述的基于组合模型的文本情感分析方法,其特征在于,步骤S20中“将编码得到的每个词的位置表示与相应词的词向量相加,获得待判断情感文本的句子表示”,其方法为:X=|v1+p1v2+p2v3+p3…vi+pi…vl+pl|T其中,vi为词向量,pi为词向量对应的位置表示,l为待判断情感文本的句子长度。5.根据权利要求1所述的基于组合模型的文本情感分析方法,其特征在于,步骤S30中“采用双向编码表示器,依据所述待判断情感文本的句子表示,获得待判断情感文本的深度双向特征表示”,其方法为:步骤S31:通过对所述待判断情感文本的句子表示进行第一设定数量的权重矩阵相乘的线性变换,对句子的表示进行降维,得到待判断情感文本的句子的第一设定数量的降维矩阵表示;步骤S32,将所述第一设定数量的降维矩阵分别进行自注意力机制操作后拼接,然后进行一次矩阵相乘的线性变换,得到待判断情感文本的句子的二次降维矩阵表示;步骤S33,将所述待判断情感文本的句子表示与待判断情感文本的句子的二次降维矩阵表示进行残差连接后进行归一化处理,获得隐层特征表示;步骤S34,将所述隐层特征表示输入位置相关的前馈网络,将...

【专利技术属性】
技术研发人员:胡卫明赵品龙
申请(专利权)人:中国科学院自动化研究所
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1