基于多通道神经网络的文本情感分析方法技术

技术编号:26222775 阅读:52 留言:0更新日期:2020-11-04 10:53
本发明专利技术涉及一种基于多通道神经网络的文本情感分析方法,属于计算机技术领域。该方法包括步骤:1、将文本进行分词并映射为词向量矩阵;2、使用长短时记忆网络和卷积神经网络提取文本的高层上下文特征和原始上下文特征;3、利用多通道结构提取并融合不同视距的高层上下文特征和原始上下文特征,并通过局部注意力机制对各通道的特征进行加权,生成全局特征;4、利用全局注意力模块突出全局特征中的重要信息,最后使用Top‑K池化策略对特征进行筛选;5、利用自适应加权损失函数减少训练数据类不平衡对模型的影响。本发明专利技术能分析文本情感并对文本所表达的情感分类,实现了文本特征的准确提取和增强,具有较强的文本情感分析能力。

【技术实现步骤摘要】
基于多通道神经网络的文本情感分析方法
本专利技术属于计算机
,涉及基于多通道神经网络的文本情感分析方法。
技术介绍
近年来,随着微博、微信、美团、Twitter等平台的兴起以及移动互联网技术的飞速发展,越来越多人习惯在网络上发表他们的观点或评论。例如:网民在微博或Twitter上发表观点或心情;消费者在美团等网站发表对餐馆或酒店的评价;购物者通过电商网站评论商品等。但是面对网络产生的海量数据,使用人工识别是十分困难且不现实的,因此如何合理的使用计算机技术处理分析数据,成为高效使用这些数据的一大难题。由于自然语言的多义性,以及情感的长期依赖性,文本情感分析是一个巨大的挑战。大多数文本中会同时包含正向和负向表述,这使得正确地判别出文本整体情感极性变得极其复杂。文本情感分析通过学习文本上下文信息判定文本情感极性,近年来得到广泛关注。文本情感分析的难点是对上下文内容关系建模以及整体情感判别。国内外研究者提出许多有效的研究方法,大多采用传统自然语言特征或机器学习的方式进行文本情感分析。传统自然语言处理任务依靠极性标签或句法结构定义丰富的特征本文档来自技高网...

【技术保护点】
1.基于多通道神经网络的文本情感分析方法,其特征在于:该方法包括以下步骤:/n步骤一:通过文本数据使用词嵌入技术训练词向量,并将文本映射为词向量矩阵;/n步骤二:使用空洞CNN和双向LSTM通过词向量矩阵提取文本的高层上下文特征,利用双向LSTM提取文本的原始上下文特征;/n步骤三:利用多通道模型,融合不同视距的上下文特征和原始上下文特征,通过局部注意力机制对各通道的特征进行加权,生成全局特征;/n步骤四:利用全局注意力模块突出全局特征中的重要信息,最后使用Top-K池化策略对特征进行筛选;/n步骤五:使用自适应加权损失函数,使模型自动关注难以分类和训练样本少的类别,以提高模型的分类性能。/n

【技术特征摘要】
1.基于多通道神经网络的文本情感分析方法,其特征在于:该方法包括以下步骤:
步骤一:通过文本数据使用词嵌入技术训练词向量,并将文本映射为词向量矩阵;
步骤二:使用空洞CNN和双向LSTM通过词向量矩阵提取文本的高层上下文特征,利用双向LSTM提取文本的原始上下文特征;
步骤三:利用多通道模型,融合不同视距的上下文特征和原始上下文特征,通过局部注意力机制对各通道的特征进行加权,生成全局特征;
步骤四:利用全局注意力模块突出全局特征中的重要信息,最后使用Top-K池化策略对特征进行筛选;
步骤五:使用自适应加权损失函数,使模型自动关注难以分类和训练样本少的类别,以提高模型的分类性能。


2.根据权利要求1所述的基于多通道神经网络的文本情感分析方法,其特征在于:所述步骤一中,词向量矩阵表示过程为:首先将原始文本数据进行分词,然后将分词处理后的文本输入Skip-gram模型训练词向量其中d代表词向量维度,从而得到词嵌入矩阵;定义文本s,其中s分词后表示为{w1,...,wt-1,wt,wt+1,...,wm},wt为文本的第t个词,m为文本所包含的单词个数,从而词嵌入层通过词嵌入矩阵将文本{w1,...,wt-1,wt,wt+1,...,wm}映射为其中,若未在词嵌入矩阵中的词,则使用d维的随机向量表示该词;为使输入保存一致,将模型输入序列长度设置为k,对于长度小于k的文本,使用d维的零向量将其词向量矩阵扩展到k×d,而对于长度大于k的文本,通过剪切将其长度限制到k;文本词向量矩阵表示为:



其中,表示连接符号。


3.根据权利要求1所述的基于多通道神经网络的文本情感分析方法,其特征在于:所...

【专利技术属性】
技术研发人员:甘臣权冯庆东张祖凡
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:重庆;50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1