【技术实现步骤摘要】
基于注意力机制和胶囊网络的方面级情感分类方法
[0001]本专利技术属于情感分析
,具体涉及基于注意力机制和胶囊网络的方面级情感分类方法
。
技术介绍
[0002]方面级情感分类是一种文本分类任务,它的目标是识别文本中与特定方面相关的情感极性
(
如积极
、
消极或中性
)。
现有的一种评论文本情感分类模型训练与情感分类装置及设备,其技术方案为:获取文本语料中的方面词;基于
LSTM
网络提取句子和方面词特征表示;基于注意力机制融合句子和方面词的特征表示,为句子表示分配权重并得到新的句子特征表示;采用双曲正切非线性映射函数将句子特征表示映射至情感类别空间,利用
Softmax
分类,训练并更新模型中的参数,得到最优情感分类模型
。
[0003]现有的情感分类模型多使用预训练模型提取文本特征,并直接基于此特征进行分类,忽略了文本中关键局部特征,无法准确识别文本情感
。
技术实现思路
[0004] ...
【技术保护点】
【技术特征摘要】
1.
基于注意力机制和胶囊网络的方面级情感分类方法,其特征在于,
SI
:将预处理后的评论文本输入预设
BERT
编码器中,以获取评论文本中上下文和方面词对应的词向量;
S2
:将上下文和方面词对应的词向量分别输入预设门控单元和长短时记忆网络,得到上下文和方面词对应的隐藏状态向量;
S3
:将上下文和方面词对应的隐藏状态向量输入注意力编码层,得到上下文和方面词的语义信息编码;
S4
:将语义信息编码进行压缩得到上下文和方面词对应的初级特征胶囊;
S5
:利用动态路由机制更新上下文和方面词对应的初级特征胶囊参数,得到高级分类胶囊,即融合方面词的上下文特征新向量;
S6
:基于特征新向量得到方面词的情感分类结果
。2.
根据权利要求1所述的基于注意力机制和胶囊网络的方面级情感分类方法,其特征在于,
S1
所述评论文本为
yelp
压缩包,预处理指的是去掉多余的标点和单词
。3.
根据权利要求1所述的基于注意力机制和胶囊网络的方面级情感分类方法,其特征在于,步骤
S2
具体如下:将所述上下文对应的词向量
w
=
{w1,
w2,
w3,
...
,
w
n
}
输入预设门循环单元
GRU
中,通过所述预设门循环单元得到上下文对应的隐藏状态向量的过程如下:
r
t
=
σ
(W
r
·
[h
t
‑1,
X
t
])
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)Z
t
=
σ
(W
z
·
[h
t
‑1,
X
t
])
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)h
′
=
tanh(W
·
[r
t
*h
t
‑1,
X
t
])
ꢀꢀꢀꢀꢀꢀ
(3)H
c
=
(1
‑
Z
t
)*h
t
‑1+Z
t
*h
′ꢀꢀꢀꢀꢀꢀ
(4)
其中,
W
r
表示重置门权重矩阵,
h
t
‑1表示预设门循环单元的上一层输出结果,
X
t
表示预设门循环单元当前层的输入,
r
t
表示重置门系数,表示当前层预期输出结果,
W
z
表示更新门权重矩阵,
H
c
表示经预设门循环单元处理得到的上下文隐藏状态向量,
σ
表示激活函数
Sigmoid
,
[]
表示连接操作;将所述方面词对应的词向量
A
=
{a1,
a2,
a3,
...
,
a
m
}
输入预设双向长短期记忆神经网络,通过所述预设双向长短期记忆神经网络得到方面词对应的隐藏状态向量的过程如下:通过所述预设双向长短期记忆神经网络得到方面词对应的隐藏状态向量的过程如下:通过所述预设双向长短期记忆神经网络得到方面词对应的隐藏状态向量的过程如下:其中,
m
表示方面词对应的词向量的维度,
LSTM
R
表示预设长短期记忆神经网络的正向更新过程,
LSTM
L
表示长短期记忆神经网络的反向更新过程,
H
t
表示方面词对应的隐藏状态向量
。4.
根据权利要求3所述的基于注意力机制和胶囊网络的方面级情感分类方法,其特征在于,步骤
S3
具体如下:将所述上下文对应的隐藏状态向量
H
c
和方面词对应的隐藏状态向量
H
t
分别输入预设注意力编码公式,得到上下文语义信息编码
H
ca
和方面词语义信息编码...
【专利技术属性】
技术研发人员:费蓉,白雪茹,邱原,李爱民,刘雅君,赵珂洁,杨璐,
申请(专利权)人:西安理工大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。