【技术实现步骤摘要】
基于自注意力的多层次融合方面类别情感分析方法
[0001]本专利技术属于应用自注意力机制对情感词语分析领域,特别涉及一种基于自注意力的多层次融合方面类别情感分析方法。
技术介绍
[0002]观点或意见几乎是所有人类进行活动的核心,是我们行为的关键影响因素。随着电子商务平台的兴起,在线评论成为宝贵的资源,尤其是对于受欢迎的产品和服务方面。从这些在线评论中识别和提取具有丰富观点的信息,有助于生产者和消费者做出决策。也就是说,评价不仅是电商销售产品的重要因素,而且在一定程度上也是影响消费者意愿的指标。但由于这些产品的评论数量巨大,要通过每一次评判对任何产品做出简单的决定是不可行的。因此,近年来,考虑到效率和大量评论数据的在线处理需求,情感分析从各个领域展开了探索。基于方面的情感分析(ABSA)作为情感分析领域的细粒度任务在近几年来受到广泛地关注,它主要包含两个子任务:方面项情感分析(ATSA)和方面类别情感分析(ACSA)。虽然近年来对ATSA和ACSA的研究都很有前景,但在本专利技术中,我们主要关注的是ACSA的任务。
[0003]ACSA的目的是在对情感极性(通常是积极的、消极的或中性的)进行分类的同时,根据方面类别对每个观点进行分类。可以看出他需要进行两个任务,方面类别识别(ACD)和方面情感分类(ASC)。与ATSA任务不同,ACSA任务中方面类别可能不会直接在句子中出现,且需要预定义。为了识别方面类别的情感,多年来人们致力于为给定方面目标建立合适的上下文特征。
[0004]在过去几十年里,早期传统 ...
【技术保护点】
【技术特征摘要】
1.一种基于自注意力的多层次融合方面类别情感分析方法,其特征在于,所述基于自注意力的多层次融合方面类别情感分析方法包括:S1:获取样本语句以及与样本语句相关联的若干组二元组标签信息;S2:采用基于Bi
‑
LSTM和卷积注意机制相结合来获取输入文本的序列信息与局部重要信息;S3:获取方面类别指示词的位置信息;S4:包含情景的自注意力机制重新学习方面信息,并引入融合多层次信息来融合学习多层次上下文特征之间的相互作用,实现方面类别情感分析;其中利用词级别和句子级别共同提取文本特征;为解决考虑情境时不可避免带入的噪声问题,而引入门控机制过滤噪声信息,以更精确地表示获取基于上下文的方面类别和有效获得重要词的位置信息。2.根据权利要求1所述的基于自注意力的多层次融合方面类别情感分析方法,其特征在于,所述步骤S1中二元组标签信息包括样本语句相关联的方面类别种类和情感极性;获取样本语句的初始句子序列,根据样本语句的初始句子序列以及二元组标签信息构建样本语句的二元组标签序列。3.根据权利要求1所述的基于自注意力的多层次融合方面类别情感分析方法,其特征在于,所述步骤S1中获取样本语句包括若干个单词。4.根据权利要求1所述的基于自注意力的多层次融合方面类别情感分析方法,其特征在于,所述步骤S2获取输入文本的序列信息与局部重要信息中的局部重要信息为短语和词组。5.根据权利要求1所述的基于自注意力的多层次融合方面类别情感分析方法,其特征在于,所述步骤S3获取方面类别指示词的位置信息是用于设计方面类别检测方法,以获得与方面类别有关的重要词语作为方面类别指示词,从而得到该词的位置信息。6.根据权利要求1所述的基于自注意力的多层次融合方面类别情感分析方法,其特征在于,所述步骤S4中引入的融合多层次信息对评论文本方面类别情感进行分析,用于实现对在线评论情感分布的精确分类。7.根据权利要求1所述的基于自注意力的多层次融合方面类别情感分析方法,其特征在于,所述步骤S1中获取样本语句的初始句子序列,具体包括:将句子序列S通过嵌入矩阵映射,获得嵌入向量序列E={x1,x2,
…
,x
n
},其中d
e
表示单词嵌入的维度,给定预定义的方面类别a
i
∈A,方面嵌入可以通过映射得到其中d
a
是方面嵌入向量维度;将单词嵌入E={x1,x2,
…
,x
n
}输入到多层Bi
‑
LSTM中,第(l
‑
1)层的输出送入下一层,则得到隐藏的上下文表示在每一时间步t,当前隐藏状态为:为:
其中l∈L表示当前Bi
‑
LSTM层的数量,d
s
/2表示Bi
‑
LSTM一个隐藏状态的维数,该层的输出是一个隐藏表示的序列式中和表示LSTM的正向传播和反向传播。8.根据权利要求1所述的基于自注意力的多层次融合方面类别情感分析方法,其特征在于,利用卷积注意机制来提取高维语义,弥补Bi
‑
LSTM无法捕捉局部特征的不足;一方面,卷积注意机制通过滤波器进行特征映射,不受卷积核大小的限制;另一方面,区别于自注意机制,它没有利用输入向量不同部分之间的信息,而是基于滤波器的内部信息,既保持了序列信息又对输入具有不变性;因此,它既能保持上下文信息也能捕捉到更重要的局部特征;首先卷积注意机制接受Bi
‑
LSTM的输出H表示作为输入,然后CNN卷积滤波器F=[f1,f2,
…
f
m
]在H上应用n元卷积运算,其中c是卷积核的大小;可以通过如下公式得到特征映射矩阵M∈R
m
×
n
:M=H*F
ꢀꢀꢀꢀ
(4)式(4)中*表示卷积操作;在对输出表示应用所有过滤器之后,特征映射矩阵中具体值的含义如下:m
ij
=ψ(f
iT
·
cat(h
j
,h
j+1
,
…
,h
j+c
‑1)+b)
ꢀꢀꢀꢀ
(5)其中cat表示拼接操作,ψ表示非线性激活函数,b为偏置值;卷积注意机制可以被视为一个信息过滤器,它过滤掉不相关的语义信息,同时保留与上下文相关的关键信息;则卷积注意向量的输出过程如下:O
M
=F
·
M=F
·
(H*F)
ꢀꢀꢀꢀ
(6)其式(6)中表示查询(H)与键(F)的卷积操作的注意权值,该模块可以有效地从卷积滤波器中获取有价值的信息,这些信息直接作用于隐藏表示,捕捉重要局部特征;接下来所提出的融合机制在卷积层之后没有使用任何的池化操作来维持输入结构,可以避免池化操作导致输入序列顺序的丢失。9.根据权利要求1所述的基于自注意力的多层次融合方面类别情感分析方法,其特征在于,所述步骤S4情景的自注意力机制重新学习方面信息是通过包含情景的自注意力机制构建的方面类别预测方法获得与方面类别有关的重要词语作为方面类别指示词,将该词所在的位置作为重要位置信息,具体步骤包括:输入层H首先转化为候选查询状态Q
k
,候选键状态K
k
和值V
k
,每个包含k个头;将d
s
维空间映射到d
k
维空间,其中d
k
=d
s
/k表示每个头的维度;类似于多头自我注意模型,允许模型从不同的表示子空间学习语义信息,情境导向的注意输出在每个头可以被定义为:
10.根据权利要求1所述的基于自注意力的多层次融合方面类别情感分析方法,其特征在于,所述步骤4中引入门控机制过滤噪声信息,以更精确地表示获取基于上下文的方面类别和有效获得重要词的位置信息,引入的上下文向量C将H转换为信息化的查询层和关键层,改进后的{Q
k
,K
k
}如下表示:其中是上下文矩阵,为可...
【专利技术属性】
技术研发人员:田东,时嘉,冯建英,张慧,苗子溦,
申请(专利权)人:中国农业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。