【技术实现步骤摘要】
一种基于句信息进行词信息增强的方面级情感分析方法
[0001]本专利技术涉及计算机领域,具体涉及一种基于句信息进行词信息增强的方面级情感分析方法。
技术介绍
[0002]情感分析是自然语言处理的一个重要子任务,旨在判断给定文本的情感极性。电影评论、商品评论等互联网文本中含有丰富的信息,通过对这些文本信息进行情感分析,可以挖掘出用户的喜好。从粒度的角度看,情感分析可以被分为篇章级、句子级和方面级。其中句子级情感分析和篇章级情感分析旨在预测整个句子或者整篇文章的情感倾向,属于粗粒度情感分析。相比前两者,方面级情感分析根据文本中的意见词判断给定方面词的情感极性,属于细粒度的情感分析。例如,给定文本“Great food but the service was dreadful.”,句中的“food”与“service”作为方面词,对应的意见词分别为“Great”和“dreadful”,显然两个方面词的情感极性相反。在实际的应用场景中,不光需要识别文章或句子所表达的意见,还需要识别观点所指向的对象,以及针对该对象所表达的具体情感倾向 ...
【技术保护点】
【技术特征摘要】
1.一种基于句信息进行词信息增强的方面级情感分析方法,其特征在于,包括以下步骤:步骤1:对句子进行预训练得到词向量;步骤2:将步骤1得到的词向量聚合得到句向量;步骤3:根据步骤2得到的句向量构建正负样本集;步骤4:根据步骤3构建的样本集和步骤2得到的句向量进行对比学习;步骤5:步骤1得到的词向量输入图卷积神经网络得到情感分类结果;构建损失函数,进行迭代,直到符合要求退出。2.根据权利要求1所述的一种基于句信息进行词信息增强的方面级情感分析方法,其特征在于,所述步骤5中图卷积神经网络包括图卷积层、平均池化层和归一化层;图卷积层中图卷积操作如下:式中:为第l层图卷积的节点更新,为节点i和节点j在句法距离k上的权重,为可训练权重,为偏置项,为非线性激活函数,n为节点个数,为节点j在l
‑
1层的卷积操作后的向量;l层的输出可以表示为,为句子i在句法距离为k的第l层卷积操作下的向量集合;平均池化层:经过p次卷积后的增强整合后得到其中:为对向量进行平均池化,~为每次卷积后的输出的增强句向量,H为经过平均池化操作后的句子向量;增强句向量屏蔽掉非方面词经平均池化得到方面术语h
a
:其中h
a1
、h
a2
…
h
am
为方面术语中的词;归一化层用于将方面术语h
a
归一化处理:h
a
经线性层降维后经softmax函数处理,得到定义的极性标签的概率分布:式中:W
p
为学习权重,b
p
为偏置项。3.根据权利要求2所述的一种基于句信息进行词信息增强的方面级情感分析方法,其特征在于,所述图卷积层中采用...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。