【技术实现步骤摘要】
一种基于图注意力网络的方面级情感分类方法
[0001]本专利技术属于自然语言处理
,具体涉及一种基于图注意力网络的方面级情感分类方法。
技术介绍
[0002]随着互联网的广泛普及,电子商务、社交媒体等应用产业得到迅猛发展,全球网民规模也不断扩大,越来越多的人通过电商平台进行购物并留下商品评价,在社交平台上分享自己的观点,表达自己的想法、态度等,因此互联网上产生了大量的用户对于诸如人物、事件、产品等有价值的评论信息,这些评论信息包含了用户的情感倾向。通常这些海量的文本数据都蕴含着巨大的商业价值,但是如何挖掘出其中有效的信息则是我们需要考虑的问题。以网上购物为例,评论数量巨大,用户很难快速定位到自己关注的商品某个特定方面的信息,单纯通过个人浏览在线评论,获得该商品的综合评价显然是不现实的。传统的情感分类只是识别一个评论整体的情感倾向,对商品所包含的具体方面、属性等并不关注,这种粗粒度的情感识别不但导致了信息提取不充分问题,更无法识别用户所关注的商品特定方面的情感倾向。所以在这种情况下,有必要建立一个对文本进行方面级别情感分类的系统。随着深度学习算法的快速发展,利用自然语言处理领域的相关技术进行文本方面级别的情感分类可以很大程度改善和提高文本有效信息的获取。
[0003]对于文本方面级情感分类,其挑战之一在于使用图注意力网络在多层网络下会出现特征信息丢失的问题,如何保障特征信息可以有效传播,以往的方法大多没有很好地解决。其挑战之二在于如何将文本句法特征和上下文语义特征充分融合,对于一条评论来说,其包含的特征不
【技术保护点】
【技术特征摘要】
1.一种基于图注意力网络的方面级情感分类方法,其特征在于,包括:S1:获取方面词所在的上下文文本的词嵌入表示,得到句子所对应的词向量;S2:在词向量中根据上下文词与方面词所处的相对位置来动态调整上下文词权重,获取上下文语义特征;S3:通过改进的图注意力网络来聚合句法信息,获取文本的句法特征;S4:使用深度交叉网络充分融合文本句法特征和上下文语义特征,得到最终特征表示;S5:将最终特征表示通过全连接层、softmax函数中进行情感预测,得到文本中该方面词的情感极性分布。2.根据权利要求1所述的一种基于图注意力网络的方面级情感分类方法,其特征在于,获取方面词所在的上下文文本的词嵌入表示,包括:给定一个包含n个词的句子s,s={w1,w2,...,w
t+1
,...,w
t+m
,...,w
n
},从句子s中提取长度为m的方面词a={w
t+1
,...,w
t+m
},将文本序列重构为“[CLS]+s+[SEP]+a+[SEP]”的形式,使用BERT预训练模型对上下文进行建模,经过BERT模型输出的特征向量表示为{e0,e1,...,e
n
‑1,e
n
,e
n+1
,e
t+1
,...,e
t+m
,e
n+2+m
},其中句子s的特征向量为h
s
={e1,e2,...,e
n
},方面词a的特征向量为h
a
={e
t+1
,e
t+2
,...,e
t+m
},记n表示文本序列的长度,d表示词嵌入维度。3.根据权利要求1所述的一种基于图注意力网络的方面级情感分类方法,其特征在于,获取上下文语义特征,包括:h
ex
=h
s
·
W其中,h
ex
表示经过特征提取层后的上下文语义特征,W表示文本的权重矩阵,W={w1,w2,...w
t
...,w
n
},w
t
表示调整后第t个单词的权重向量,E表示单位列向量,γ表示以方面词为中心的局部区域的阈值,D
t
表示上下文中第t个单词与方面词之间的语义相对距离,P
t
表示上下文中第t个单词的位置,P
asp
表示方面词的中心位置,len表示方面词的长度,n表示句子长度,和分别表示当计算结果不为整数时向上取整和向下取整。4.根据权利要求1所述的一种基于图注意力网络的方面级情感分类方法,其特征在于,获取文本的句法特征,包括:S31:对文本进行句法解析生成相应的句法依存树,通过句法依存树将输入文本信息转换成包含N个节点的句法图结构,无向图结构和有向图结构,图中每个节点表示句子中的一个词,边表示每个词之间的句法依赖关系,节点i的邻居节点可以表示为N(i);S32:分别将文本信息的无向图结构和有向图结构输入改进的图注意力网络ImGAT,所述改进的图注意力网络(...
【专利技术属性】
技术研发人员:唐宏,刘蓓明,杨浩澜,孙锐,黄水文,
申请(专利权)人:重庆邮电大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。