【技术实现步骤摘要】
一种基于图注意力网络的方面级情感分析模型的构建方法
[0001]本专利技术属于计算机应用
,特别是涉及一种基于图注意力网络的方面级情感分析模型的构建方法。
技术介绍
[0002]随着近年来使用网络的人数越来越多,诸多领域的互联网产品层出不穷,例如:社交媒体领域的微博、论坛;电子商务领域的淘宝、京东;新闻媒体领域的新浪新闻和搜狐新闻等。借助这些平台,人们可以在网上方便地发表言论,表达自己的观点和意见。因此,在各大平台分析用户言语中的情感倾向,对政府知道民兴所向,为名服务有重要作用;对商家而言,知道客户的喜好,有助于商家推出新的产品,改进自身的服务。因此,通过自然语言处理技术,得到情感分析的结果是有重大意义的。
[0003]情感分析是文本挖掘的主要任务之一,又称为意见挖掘,其目的是分析在线评论数据中包含的意见、情绪和态度。情感分析又分为三个级别:文档级、句子级、方面级。文档级情感分析是分析文档整体所传达的情感极性,句子级情感分类则是确定单个句子所表现出的情感极性。然而,实际上,一个句子中,可能包含很多方面,而每一个 ...
【技术保护点】
【技术特征摘要】
1.一种基于图注意力网络的方面级情感分析模型的构建方法,其特征在于:所述方法具体为:步骤1:通过Glove词嵌入技术对文本进行编码,并得到词嵌入矩阵;步骤2:使用双向LSTM来编码上下文信息,得到隐藏向量表示;步骤3:使用Spacy依存解析工具获取原始的句法依赖树;步骤4:将原始的句法依赖树通过剪枝规则进行剪枝获得新的句法依赖树;步骤5:使用图注意力网络对剪枝后的句法依赖树进行编码得到句法特征;步骤6:首先对步骤5得到的特征表示进行一个平均池化操作以保留大多数重要的信息,接着进行一个线性变换再softmax操作得到最后的预测结果表示。2.根据权利要求1所述的方法,其特征在于:在步骤1中,设是预训练的Glove词嵌入矩阵,其中d
e
是词向量的维度,|Voc|是词汇数量;单词的向量表示是其通过查找词嵌入矩阵E
w
得到的,并由此得到嵌入矩阵E=[x1,x2,...,x
n
]。3.根据权利要求1所述的方法,其特征在于:在步骤2中,利用双向LSTM对文本进行从左到右和从右到左两个方面的编码,得到两个隐藏特征,并将它们进行拼接,得到每个词双向的隐藏向量表示:的隐藏向量表示:的隐藏向量表示:其中,是自左到右的LSTM在t时刻的输出,是自右到左的LSTM在t时刻的输出,e
t
表示t时刻的输入,h
t
是Bi
‑
LSTM在t时刻的最终输出,“;”是向量的拼接操作。4.根据权利要求1所述的方法,其特征在于:在步骤4中,将原始的句法依赖树通过剪枝规则进行剪枝获得新的句法依赖树的具体步骤如下:步骤4.1,计算各个节点到目标方面的句法距离dist,如果目标方面由多个单词组成,则用目标方面的最后一个单词代替该方面;步骤4.2,设置阈值k,对dist大于k的依赖边进行剪枝,得到剪枝后的句法依赖树,并依据此树构建图G。5.根据权利要求1所述的方法,其特征在于:在步骤5中,图注意力网络根据图中的路径在节点之间进行信息传播,通过聚合领域节点的信息进行节点更新,具体步骤如下:步骤5.1,先通过多头注意力机制计...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。