一种基于深度学习的面向方面级情感分析的句法依赖方法技术

技术编号：27835819 阅读：32 留言：0更新日期：2021-03-30 12:00

本发明专利技术公开了一种基于深度学习的面向方面级情感分析的句法依赖方法，提高了方面级情感分析的准确性。该方法包括以下步骤：S1，将输入的句子利用预训练好的词向量进行表示；S2，将S1得到的词向量输入到卷积层以提取序列的局部特征；S3，将卷积过后的特征向量输入到BiLSTM层，通过两个方向的LSTM单元获取上下文中的语义信息；S4，将S3得到的语义信息输入到临近加权卷积层以捕获n

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习的面向方面级情感分析的句法依赖方法

[0001]本专利技术涉及自然语言处理的情感分析
，尤其涉及一种基于深度学习的面向方面级情感分析的句法依赖方法。

技术介绍

[0002]情感分析(Sentiment analysis)是文本挖掘领域的一个热门话题，它是对文本中的观点、情感和主观性的计算。情感分析有三个层次的粒度，即文档级(document
‑
level)、句子级(sentence
‑
level)和方面级(aspect
‑
level)。当一个文档或一个句子涉及多个情感表达时，前两个层面的情感分析将无法准确提取文本内部的深层情感。而方面级情感分类(也称为基于方面的情感分类)是一个细粒度的情感分类任务，旨在识别特定上下文中某个方面的极性，即评论或评论。例如，对于“价格足够合理，服务很差”这句话，“价格”和“服务”这两个词是方面的，对“价格”和“服务”的态度分别是积极的和消极的。
[0003]与情感分析中的其他粒度级别不同，句子中不同方面的情感极性需要在方面级情感分析中确定，它不仅依赖于上下文信息，还依赖于不同方面的情感信息。此外，一句话中不同的具体方面可能会有完全相反的情感极性，因此分析针对个别方面的具体情感极性可以更有效地帮助人们理解用户的情感表达，从而引起该领域越来越多的关注。早期在方面级情感分析方面的工作主要基于从统计学的角度手动提取定义的特征，并采用机器学习，如支持向量机(support vector machine)、条件随机场...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的面向方面级情感分析的句法依赖方法，其特征在于：包括以下步骤：S1，将输入的句子利用预训练好的词向量进行表示；S2，将S1得到的词向量输入到卷积层以提取序列的局部特征；S3，将卷积过后的特征向量输入到BiLSTM层，通过两个方向的LSTM单元获取上下文中的语义信息；S4，将S3得到的语义信息输入到临近加权卷积层以捕获n
‑
gram信息；S5，将临近加权卷积后得到的n
‑
gram信息输入到池化层进行最大池化操作，提取重要特征；S6，将最大池化操作得到的输出通过softmax分类层进行分类，得到最终结果。2.根据权利要求1所述的基于深度学习的面向方面级情感分析的句法依赖方法，其特征在于：其中步骤S1所述预训练词向量是指通过Google提出来的BERT预训练模型，它能够捕捉明显的单词差异，例如多义性。此外，这些上下文敏感的单词嵌入还检索其他形式的信息，这可能有助于产生更准确的特征表示和提高模型性能。输入数据用x表示，H是用BERT处理x后生成的嵌入，公式如下：H＝BERT(x) 。3.根据权利要求1所述的基于深度学习的面向方面级情感分析的句法依赖方法，其特征在于：步骤S2中卷积层用于提取序列中的局部特征；其输出为：式中表示卷积，权重矩阵的符号由w
m
∈R
k
×
d
表示，对应于滤波器F
m
；b
m
代表偏差，X
i:i+k
‑1表示滑动矩阵窗口，包括输入矩阵中i到i+k
‑
1行；f是一个非线性激活函数，这里本专利选择了RELU。符号代表从滤波器F
m
生成的特征图，为y
m
的第i个元素。4.根据权利要求1所述的基于深度学习的面向方面级情感分析的句法依赖方法，其特征在于：步骤S3所述BiLSTM层采用双向LSTM网络，分别由前向和后向神经网络组成，分别负责记忆过去和未来的信息，促进文本分析，其中一个标准的LSTM单元通常包含三个门和一个单元存储器状态，即忘记门、输入门、输出门和存储单元。W
i
,U
i
∈R
d
×
2d
是对应于输入门i
t
的加权矩阵；W
f
,U
f
∈R
d
×
2d
是对应于忘记门f
t
的加权矩阵；W
o
,U
o
∈R
d
×
2d
是对应于输出门o
t
的加权矩阵。b
...

【专利技术属性】
技术研发人员：陈思溢，杜鑫浩，陈小龙，
申请(专利权)人：湘潭大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人