基于再注意力机制的文本情绪分类方法及系统技术方案

技术编号:28710411 阅读:23 留言:0更新日期:2021-06-05 23:55
本公开提供了一种基于再注意力机制的文本情绪分类方法及系统,获取文本中的文字数据,并对获取的文字数据进行预处理;将预处理后的文字数据输入到预设神经网络分类模型,得到情绪分类结果;其中,预设神经网络分类模型中,包括再注意力层和多个神经网络层,再注意力层对每个神经网络层的输出向量进行特征选择;本公开在现有自注意力文本特征选择基础上,增加了特征再注意的机制,极大的提高了情绪分类的准确率。绪分类的准确率。绪分类的准确率。

【技术实现步骤摘要】
基于再注意力机制的文本情绪分类方法及系统


[0001]本公开涉及文本数据处理
,特别涉及一种基于再注意力机制的文本情绪分类方法及系统。

技术介绍

[0002]本部分的陈述仅仅是提供了与本公开相关的
技术介绍
,并不必然构成现有技术。
[0003]人的情绪波动以及舆论的动向是维系社会稳定的重要影响因素。如何能够正确分析人民群众的情绪变化并及时发现热点事件,是亟需解决的问题。
[0004]专利技术人发现,虽然如今各种大数据舆情分析系统层出不穷,许多初创公司也瞄准了这一方向,但是大多数的分析系统还存在着以下几点问题:依赖关键词分析,多数情感分析技术还在依靠特定关键词,如“哈哈”、“生气”等,来评判网民情绪,这种方法只能分析具有明确情感词语的句子,而对没有明确情感词语的句子,分类准确率大打折扣。

技术实现思路

[0005]为了解决现有技术的不足,本公开提供了一种基于再注意力机制的文本情绪分类方法及系统,在现有自注意力文本特征选择基础上,增加了多层特征的再注意机制,极大的提高了情绪分类的准确率。/>[0006]为了本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于再注意力机制的文本情绪分类方法,其特征在于:包括以下过程:获取文本中的文字数据,并对获取的文字数据进行预处理;将预处理后的文字数据输入到预设神经网络分类模型,得到情绪分类结果;其中,预设神经网络分类模型中,包括再注意力层和多个神经网络层,再注意力层对每个神经网络层的输出向量进行特征选择。2.如权利要求1所述的基于再注意力机制的文本情绪分类方法,其特征在于:神经网络层为基于双向Transformer的神经网络层,用于得到输入语句的嵌入式表达。3.如权利要求1所述的基于再注意力机制的文本情绪分类方法,其特征在于:对获取的文字数据进行预处理,包括:将文字数据以语句形式表示,并将一条语句截断成预设字符数量的多个。4.如权利要求3所述的基于再注意力机制的文本情绪分类方法,其特征在于:在每条语句的最前面添加预设标记,将添加标记后的语句输入到预设神经网络分类模型的第一个神经网络层中,在最后一个神经网络层中得到语句的隐含向量。5.如权利要求4所述的基于再注意力机制的文本情绪分类方法,其特征在于:隐含向量中包含有指示预设标记位置的位置向量,隐含向量中的某个子向量的权重根据此向量与位置向量的得分计算得到。6.如权利要求5所述的基于再注意力机制的文本情绪分类方法,其特征在于:利用再注意力...

【专利技术属性】
技术研发人员:吴士伟陈通李慧娟展一鸣李钊辛国茂
申请(专利权)人:山东亿云信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1