基于嵌入表情符号的Bi-GRU神经网络的网络短文情感分类方法技术

技术编号:38821036 阅读:26 留言:0更新日期:2023-09-15 20:00
一种基于嵌入表情符号的Bi

【技术实现步骤摘要】
基于嵌入表情符号的Bi

GRU神经网络的网络短文情感分类方法


[0001]本专利技术涉及自然语言处理的的
,具体涉及到一种基于嵌入表情符号的Bi

GRU神经网络的网络短文情感分类方法。

技术介绍

[0002]当前,以微信、QQ和微博为代表的沟通方式实现了高效、便捷的信息和价值观传递。此类网络短文本中的文字不仅可以传递情感,同时表情符号作为一种新型图形表达方式,也可以帮助人们表达更强烈的情绪或间接表达更微妙的情感,挖掘这种情感关系不仅有助于理解人们的观点,而且对NLP技术的应用研究有着重要推动作用。
[0003]情感分析是自然语言处理领域的一个重要分支,其目标是从文本中分析出人们对于实体及其属性所表达的情感倾向以及观点,广泛应用于社会舆情分析和内容推荐等方面。对网络短文进行更细致的情感分类也变成了情感分析中一个重要且富有挑战性的话题。随着时代的变化,人们在网络短文本中不仅使用文字来表达自己的情感,而且在大部分网络短文本中都用表情符号更简单直接地流漏出情感,因此整个网络短文本句子的情感类别与表情本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于嵌入表情符号的Bi

GRU神经网络的网络短文情感分类方法,其特征在于,包括以下步骤:步骤1.数据处理获取嵌入表情符号的网络短文本序列,对嵌入表情符号的网络短文本序列进行拆分处理得到纯文本序列和表情序列,将纯文本序列和表情序列输入嵌入层,使用Word2vec分布式词嵌入编码方式进行编码,转换为计算机能够识别的纯文本嵌入向量和表情嵌入向量;步骤2.将纯文本嵌入向量输入到Bi

GRU模型,Bi

GRU模型对句子的前向信息和后向信息进行汇总并对这两个方向的信息进行合并,得到Bi

GRU模型的隐含向量;步骤3.将隐含向量输入注意力层获得句子的加权和步骤3.1.将隐含向量输入到注意力层中,通过下式(1)得到每个词的注意力权重a
i
,score(h
i
,e)=V
T
tanh(W
h
h
i
+W
E
e+b)式中,N为纯文本序列中词的总数量,h
i
为第i个词的隐含向量,h
j
第j个词的隐含向量,e为表情向量,V为纯文本序列中词的向量叠加,T为转置操作,tanh为双曲正切函数,W
h
为词嵌入矩阵,W
E
为表情嵌入矩阵,b为偏置参数;步骤3.2.按照下式(2)构建情感词向量,将情感词向量和步骤2得到隐含向量进行融合得到融合隐含向量;式中,v
at
为情感词向量,k为情感词总数量,v
x
为第x个情感词;步骤3.3.构建感知机,将融合隐含向量和步骤1得到的纯文本嵌入向量输入感知器共同学习得到新隐藏向量和上下文向量;步骤3.4.将新隐藏向量和上下文向量输入到注意力层中,通过下式(3)得到句子S;式中,h
i
为步骤2得到的第i个隐含向量;步骤4.将步骤1得到的表情嵌入向量输入到注意力层中获得表情注意力权重,然后将表情注意力权重与步骤3.4得到的句子S融合后输入到Dense层进行防过拟合化处理,然后将处理后的结果输入到改进的Softmax分类器中进行网络短文本情感分类;步骤5.使用交叉熵损失函数不断地更新迭代优化Bi

GRU模型,使交叉熵误差最小化,并且使用Adam梯度下降法对交叉熵损失函数进行优化。2.根据权利要求1所述基于嵌入表情符号的Bi

GRU神经网络的网络短文情感分类方法,其特征在于,所述步骤4中改进的Softmax分类器的公式如下:d
c
=W
c
l
c

【专利技术属性】
技术研发人员:马苗杨云启郭敏裴炤
申请(专利权)人:陕西师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1