【技术实现步骤摘要】
一种基于注意力机制的方面级文本情感分析方法及系统
[0001]本专利技术涉及自然语言处理领域,具体涉及一种基于注意力机制的方面级文本情感分析方法及系统。
技术介绍
[0002]近些年来全球互联网行业得到快速发展,随着先进的数字化技术得到应用,我们可以看到网络上用户生成内容的大量增加,大量的文本数据得以生成。这些内容提供了人们对不同主题以及事物的意见。这一巨大变化也促进了文本情感分析这一研究领域的蓬勃发展。文本情感分析又称观点挖掘、倾向性分析,是人们对产品、服务、问题、事件以及主题等实体的观点、情感、态度及其属性的计算研究。情感分析可以跟踪公众对特定实体的情绪,以创建可操作的知识。此外,这种类型的知识还可以被用来理解、解释和预测社会现象,例如当某一政策发行之后,决策者可根据受众的情感倾向来及时调整相关政策,使得政策更加合理,实施更加顺利。情感分析目前已经成为自然语言处理(Natural Language Processing,NLP)中最活跃的研究领域之一,也在数据挖掘,Web挖掘,文本挖掘和信息检索方面有广泛的应用。事实上, ...
【技术保护点】
【技术特征摘要】
1.一种基于注意力机制的方面级文本情感分析方法,其特征在于,包括:对文本数据进行预处理;将预处理后的文本数据转换为包含上下文语境信息的词向量;将得到的词向量输入文本情感分析模型,输出得到文本情感倾向;其中,文本情感分析模型包括若干神经网络单元、若干局部注意力机制单元、全局注意力机制单元、权重融合单元、全连接层和softmax层,若干神经网络单元和若干局部注意力机制单元依次交替连接,全局注意力机制单元的输入连接第一级神经网络的输入和最后一级神经网络的输出,权重融合单元同时与各局部注意力机制单元和全局注意力机制单元连接。2.根据权利要求1所述的一种基于注意力机制的方面级文本情感分析方法,其特征在于,每个局部注意力机制单元根据上一级神经网络单元的输入与输出进行权重计算,输出带注意力的词向量,作为下一级神经网络单元的输入;全局注意力机制单元根据第一级神经网络单元的输入与最后一级神经网络单元的输出进行权重计算,输出带全局注意力权重的词向量;权重融合单元将各个局部注意力机制单元的权重和全局注意力机制单元的权重进行融合得到融合权重,融合权重与最后一级局部注意力机制单元的输出作乘积累加,输出对应的词向量,各词向量经融合后输入全连接层中;经全连接层处理后的数据输入softmax层进行情感极性分类,输出得到文本情感倾向。3.根据权利要求1所述的一种基于注意力机制的方面级文本情感分析方法,其特征在于,所述若干神经网络单元中,前M个神经网络单元采用BiGRU网络,其余神经网络单元采用GCN网络,1≦M<N,N为神经网络单元的个数。4.根据权利要求1所述的一种基于注意力机制的方面级文本情感分析方法,其特征在于,所述对文本数据进行预处理,包括:删除文本数据中的重复评论、表情符号和动静态图类评论,获得结构化文本数据。5.根据权利要求1所述的一种基于注意力机制的方面级文本情感分析方法,其特征在于,采用基于transformer的BERT预训练模型将预处理后的文本数据转换为包含上下文语境信息的词向量,具体包括:采用BERT预训练模型对预处理后的文本数据进行词切割,将完整的句子切割成单个的字词;对所获得的字词进行语义编码、位置编码和段落编码,得到包含上下文语境信息的词向量。6.根据权利要求2所述的一种基于注意力机制的方面级文本情感分析方法,其特征在于,所述每个局部注意力机制单元根据上一级神经网络单元的输入与输出进行权重计算,输出带注意力的词向量,作为下一...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。