基于自注意力的多层次融合方面类别情感分析方法技术

技术编号:38134625 阅读:8 留言:0更新日期:2023-07-08 09:45
本发明专利技术公开了属于应用自注意力机制对情感词语分析领域的一种基于自注意力的多层次融合方面类别情感分析方法;该方法主要包括:获取样本语句以及与所述样本语句的相关联的若干组二元组标签信息;结合Bi

【技术实现步骤摘要】
基于自注意力的多层次融合方面类别情感分析方法


[0001]本专利技术属于应用自注意力机制对情感词语分析领域,特别涉及一种基于自注意力的多层次融合方面类别情感分析方法。

技术介绍

[0002]观点或意见几乎是所有人类进行活动的核心,是我们行为的关键影响因素。随着电子商务平台的兴起,在线评论成为宝贵的资源,尤其是对于受欢迎的产品和服务方面。从这些在线评论中识别和提取具有丰富观点的信息,有助于生产者和消费者做出决策。也就是说,评价不仅是电商销售产品的重要因素,而且在一定程度上也是影响消费者意愿的指标。但由于这些产品的评论数量巨大,要通过每一次评判对任何产品做出简单的决定是不可行的。因此,近年来,考虑到效率和大量评论数据的在线处理需求,情感分析从各个领域展开了探索。基于方面的情感分析(ABSA)作为情感分析领域的细粒度任务在近几年来受到广泛地关注,它主要包含两个子任务:方面项情感分析(ATSA)和方面类别情感分析(ACSA)。虽然近年来对ATSA和ACSA的研究都很有前景,但在本专利技术中,我们主要关注的是ACSA的任务。
[0003]ACSA的目的是在对情感极性(通常是积极的、消极的或中性的)进行分类的同时,根据方面类别对每个观点进行分类。可以看出他需要进行两个任务,方面类别识别(ACD)和方面情感分类(ASC)。与ATSA任务不同,ACSA任务中方面类别可能不会直接在句子中出现,且需要预定义。为了识别方面类别的情感,多年来人们致力于为给定方面目标建立合适的上下文特征。
[0004]在过去几十年里,早期传统的机器学习方法吸引较多人的研究,但这些方法严重依赖复杂的人工规则和特征工程,这样很容易忽视有效特征。随着深度学习技术的广泛应用,人们开始使用数据驱动的方式解决传统方法特征丢失问题。其中基于卷积神经网络(CNN)和递归神经网络(RNN)比如长短期记忆网络(LSTM)的大量有关研究被成功地应用于方面级情感分析中。CNN能够从时间或空间分布中学习局部特征,但在获取远程依赖以及建模序列信息方面存在不足。与CNN相比,RNN能够对序列信息进行有效建模,但缺乏位置不变性以及对局部信息的敏感性。上述方法使用不同的神经网络结构对语境和目标之间的关系进行建模,但考虑输入序列全部信息过于冗余,没有明确地建模每个词对识别特定目标情感的贡献程度。
[0005]注意力机制的出现在自然语言处理和计算机视觉掀起了热潮,因为它可以通过映射词的语义关联来捕捉每个词对特定目标的影响,也为模型添加了一定的可解释性。其变体自注意力机制在自然语言、图像识别领域也被证实有效。因此很多学者开始将自注意力的优势应用于该任务中。它的目的是获得一种考虑全局上下文的潜在表示,可以解决长期依赖不足的问题。此外,也有些研究构建基于依存树的图结构实现ACSA,但局限性在于需要寻找与方面类别相关的方面术语。而有些文本存在不规范的问题且方面类别通常不在文中明确描述出来,很难通过语言规则(例如依赖解析器)明确地利用上下文词和方面类别之间
的关系。而自注意力机制能够学习句子内部结构特征,可以识别句子结构的差异,获得较好的学习效果。但自我注意通过加权平均操作将所有元素考虑在内,分散了注意力分布,这在ACSA中具有一定的局限性。因为可能会导致方面类别和情感匹配有误,造成结果的不准确。因此一个考虑上下文语义的自注意力网络提出,并被应用于ABSA中。
[0006]虽然以往的研究带来了显著的改进,但由于以下原因在大多数实际应用中仍然存在一些挑战:首先,ACSA任务的挑战之一是方面类别可能不在文本中出现,而这些模型利用给定的方面来指导句子编码,但却忽视了不同环境下方面表示的含义可能会存在不同,使得易受到其他方面类别有关较强情感词的干扰,使得上下文和方面信息的交互不足,效果不好。其次,大多数方法忽视了句子中重要词的位置信息对情感极性的影响,或只是将目标与句子特征拼接获得注意权重。但这样得到的位置向量可能会因为不同环境下词语对不同方面表示表达的情感存在不同而收到干扰,从而影响模型的性能。最后,ACSA的任务更多关注餐饮、电子产品等领域,但还未探索生鲜农产品在线评论的价值。新鲜葡萄是世界上最受欢迎的水果品种之一,因其丰富的营养价值和感官特性而受到消费者的高度赞赏。因此需要更进一步的研究来更好地了解消费者对鲜食葡萄在电商平台中的期望,以提升商家及产品质量。

技术实现思路

[0007]本专利技术的目的是提供的一种基于自注意力的多层次融合方面类别情感分析方法,其特征在于,所述基于自注意力的多层次融合方面类别情感分析方法包括:
[0008]S1:获取样本语句以及与样本语句相关联的若干组二元组标签信息;
[0009]S2:采用基于Bi

LSTM和卷积注意机制相结合来获取输入文本的序列信息与局部重要信息;
[0010]S3:获取方面类别指示词的位置信息;
[0011]S4:包含情景的自注意力机制重新学习方面信息,并引入融合多层次信息来融合学习多层次上下文特征之间的相互作用,实现方面类别情感分析;其中利用词级别和句子级别共同提取文本特征;为解决考虑情境时不可避免带入的噪声问题,而引入门控机制过滤噪声信息,以更精确地表示获取基于上下文的方面类别和有效获得重要词的位置信息。
[0012]所述步骤S1中二元组标签信息包括样本语句相关联的方面类别种类和情感极性;获取样本语句的初始句子序列,根据样本语句的初始句子序列以及二元组标签信息构建样本语句的二元组标签序列。
[0013]所述步骤S1中获取样本语句包括若干个单词。
[0014]所述步骤S2获取输入文本的序列信息与局部重要信息中的局部重要信息为短语和词组。
[0015]所述步骤S3获取方面类别指示词的位置信息是用于设计方面类别检测方法,以获得与方面类别有关的重要词语作为方面类别指示词,从而得到该词的位置信息;
[0016]所述步骤S4中引入的融合多层次信息对评论文本方面类别情感进行分析,用于实现对在线评论情感分布的精确分类。
[0017]所述步骤S1中获取样本语句的初始句子序列,具体包括:
[0018]将句子序列S通过嵌入矩阵映射,获得嵌入向量序列E={x1,x2,

,x
n
},其中
d
e
表示单词嵌入的维度,给定预定义的方面类别a
i
∈A,方面嵌入可以通过映射得到其中d
a
是方面嵌入向量维度;
[0019]将单词嵌入E={x1,x2,

,x
n
}输入到多层Bi

LSTM中,第(l

1)层的输出送入下一层,则得到隐藏的上下文表示在每一时间步t,当前隐藏状态为:
[0020][0021][0022][0023]其中l∈L表示当前Bi

LSTM层的数量,d
s
/2表示Bi

LSTM一个隐藏状态的维数,该层的输出是一本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于自注意力的多层次融合方面类别情感分析方法,其特征在于,所述基于自注意力的多层次融合方面类别情感分析方法包括:S1:获取样本语句以及与样本语句相关联的若干组二元组标签信息;S2:采用基于Bi

LSTM和卷积注意机制相结合来获取输入文本的序列信息与局部重要信息;S3:获取方面类别指示词的位置信息;S4:包含情景的自注意力机制重新学习方面信息,并引入融合多层次信息来融合学习多层次上下文特征之间的相互作用,实现方面类别情感分析;其中利用词级别和句子级别共同提取文本特征;为解决考虑情境时不可避免带入的噪声问题,而引入门控机制过滤噪声信息,以更精确地表示获取基于上下文的方面类别和有效获得重要词的位置信息。2.根据权利要求1所述的基于自注意力的多层次融合方面类别情感分析方法,其特征在于,所述步骤S1中二元组标签信息包括样本语句相关联的方面类别种类和情感极性;获取样本语句的初始句子序列,根据样本语句的初始句子序列以及二元组标签信息构建样本语句的二元组标签序列。3.根据权利要求1所述的基于自注意力的多层次融合方面类别情感分析方法,其特征在于,所述步骤S1中获取样本语句包括若干个单词。4.根据权利要求1所述的基于自注意力的多层次融合方面类别情感分析方法,其特征在于,所述步骤S2获取输入文本的序列信息与局部重要信息中的局部重要信息为短语和词组。5.根据权利要求1所述的基于自注意力的多层次融合方面类别情感分析方法,其特征在于,所述步骤S3获取方面类别指示词的位置信息是用于设计方面类别检测方法,以获得与方面类别有关的重要词语作为方面类别指示词,从而得到该词的位置信息。6.根据权利要求1所述的基于自注意力的多层次融合方面类别情感分析方法,其特征在于,所述步骤S4中引入的融合多层次信息对评论文本方面类别情感进行分析,用于实现对在线评论情感分布的精确分类。7.根据权利要求1所述的基于自注意力的多层次融合方面类别情感分析方法,其特征在于,所述步骤S1中获取样本语句的初始句子序列,具体包括:将句子序列S通过嵌入矩阵映射,获得嵌入向量序列E={x1,x2,

,x
n
},其中d
e
表示单词嵌入的维度,给定预定义的方面类别a
i
∈A,方面嵌入可以通过映射得到其中d
a
是方面嵌入向量维度;将单词嵌入E={x1,x2,

,x
n
}输入到多层Bi

LSTM中,第(l

1)层的输出送入下一层,则得到隐藏的上下文表示在每一时间步t,当前隐藏状态为:为:
其中l∈L表示当前Bi

LSTM层的数量,d
s
/2表示Bi

LSTM一个隐藏状态的维数,该层的输出是一个隐藏表示的序列式中和表示LSTM的正向传播和反向传播。8.根据权利要求1所述的基于自注意力的多层次融合方面类别情感分析方法,其特征在于,利用卷积注意机制来提取高维语义,弥补Bi

LSTM无法捕捉局部特征的不足;一方面,卷积注意机制通过滤波器进行特征映射,不受卷积核大小的限制;另一方面,区别于自注意机制,它没有利用输入向量不同部分之间的信息,而是基于滤波器的内部信息,既保持了序列信息又对输入具有不变性;因此,它既能保持上下文信息也能捕捉到更重要的局部特征;首先卷积注意机制接受Bi

LSTM的输出H表示作为输入,然后CNN卷积滤波器F=[f1,f2,

f
m
]在H上应用n元卷积运算,其中c是卷积核的大小;可以通过如下公式得到特征映射矩阵M∈R
m
×
n
:M=H*F
ꢀꢀꢀꢀ
(4)式(4)中*表示卷积操作;在对输出表示应用所有过滤器之后,特征映射矩阵中具体值的含义如下:m
ij
=ψ(f
iT
·
cat(h
j
,h
j+1


,h
j+c
‑1)+b)
ꢀꢀꢀꢀ
(5)其中cat表示拼接操作,ψ表示非线性激活函数,b为偏置值;卷积注意机制可以被视为一个信息过滤器,它过滤掉不相关的语义信息,同时保留与上下文相关的关键信息;则卷积注意向量的输出过程如下:O
M
=F
·
M=F
·
(H*F)
ꢀꢀꢀꢀ
(6)其式(6)中表示查询(H)与键(F)的卷积操作的注意权值,该模块可以有效地从卷积滤波器中获取有价值的信息,这些信息直接作用于隐藏表示,捕捉重要局部特征;接下来所提出的融合机制在卷积层之后没有使用任何的池化操作来维持输入结构,可以避免池化操作导致输入序列顺序的丢失。9.根据权利要求1所述的基于自注意力的多层次融合方面类别情感分析方法,其特征在于,所述步骤S4情景的自注意力机制重新学习方面信息是通过包含情景的自注意力机制构建的方面类别预测方法获得与方面类别有关的重要词语作为方面类别指示词,将该词所在的位置作为重要位置信息,具体步骤包括:输入层H首先转化为候选查询状态Q
k
,候选键状态K
k
和值V
k
,每个包含k个头;将d
s
维空间映射到d
k
维空间,其中d
k
=d
s
/k表示每个头的维度;类似于多头自我注意模型,允许模型从不同的表示子空间学习语义信息,情境导向的注意输出在每个头可以被定义为:
10.根据权利要求1所述的基于自注意力的多层次融合方面类别情感分析方法,其特征在于,所述步骤4中引入门控机制过滤噪声信息,以更精确地表示获取基于上下文的方面类别和有效获得重要词的位置信息,引入的上下文向量C将H转换为信息化的查询层和关键层,改进后的{Q
k
,K
k
}如下表示:其中是上下文矩阵,为可...

【专利技术属性】
技术研发人员:田东时嘉冯建英张慧苗子溦
申请(专利权)人:中国农业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1