一种基于多视角相邻跨度增强的方面级情感分类方法技术

技术编号:39572980 阅读:7 留言:0更新日期:2023-12-03 19:24
本发明专利技术公开了一种基于多视角相邻跨度增强的方面级情感分类方法,属于情感分析技术领域

【技术实现步骤摘要】
一种基于多视角相邻跨度增强的方面级情感分类方法


[0001]本专利技术涉及情感分析
,具体涉及一种基于多视角相邻跨度增强的方面级情感分类方法


技术介绍

[0002]随着社交媒体和在线评论的普及,人们越来越多地在互联网上表达自己的观点和情感

这导致了大量的文本数据涉及多个方面,例如产品评论

酒店评价和电影评论等,在这些场景中,仅仅了解整体情感是不够的,我们需要深入了解文本中不同方面的情感

例如,在产品评论中,了解哪些方面受到用户的积极评价或负面评价可以帮助企业改进产品的具体要素,提升用户体验

基于方面的情感分类的主要目的是判断表达意见的句子中方面词的情感极性
(
积极

消极

中性
)。
方面级情感分类是一个面向实体级

细粒度的情感分析挑战

[0003]进一步地,现有方面级情感分类方法大多关注于如何建立方面词与意见词之间的语义关联,而忽略了方面词与意见词之间的对齐,从而导致了语义不匹配问题

为此,本专利提出了一种基于多视角相邻跨度增强的方面级情感分类方法及系统,解决方面词与意见词的语义不匹配问题,提高分类的准确性


技术实现思路

[0004]为解决现有技术中存在的问题,本专利技术提供了一种基于多视角相邻跨度增强的方面级情感分类方法及系统,从方面词相邻单词的不同语义组合出发,利用注意力机制,提出了一种新颖的方面级情感分类模型结构,可有效地从不同视角建模方面词的情感表达以便于将意见词与其对应的方面词对齐,实现方面词情感极性的预测,解决了上述
技术介绍
中提到的问题

[0005]为实现上述目的,本专利技术提供如下技术方案:一种基于多视角相邻跨度增强的方面级情感分类方法,所述方面级情感分类方法具体步骤如下:
[0006]步骤
S10
:构造基于
Bert
的句子语义信息表示模型,建立以方面词为导向的上下文表示;
[0007]步骤
S20
:构造移动掩码机制,根据上下文单词与方面词的相对距离构造方面词的多个相邻跨度,生成多个相邻跨度增强的上下文表示;
[0008]步骤
S30
:提取每个相邻跨度增强上下文表示中分类符构造对应的全局表示,构造基于全局表示的多视角注意力机制,建立句子的多视角情感表示;
[0009]步骤
S40
:利用全局平均池化层结合多视角情感表示形成综合情感表示,实现句子情感极性的预测

[0010]优选的,所述步骤
S10
的具体步骤如下:
[0011]步骤
S101
,句子原始表示为
S

{w1,


w
n
}

n
为句子中单词的数量,其中方面词表示为
A

{w
a+1



w
a+m
}
,其中
a+1
为方面词中第一个单词在句子中的位置,
m
为方面词的单词
数量,使用预训练语言模型
BERT
将句子映射到输入向量其中包括一个类别标记和
n
个单词标记,
d
是输入向量的嵌入维数,将句子方面词对构造为“[CLS]句子
[SEP]方面
[SEP]”作为
BERT
编码器的输入,得到以方面词为导向的句子上下文表示
H

{h
CLS

h1,


h
n
}。
[0012]优选的,所述步骤
S20
的具体步骤如下:
[0013]步骤
S201
,构建多个内聚单元,称为相邻跨度,以对方面词之前和之后的单词和方面词本身进行建模,不同的相邻跨度包含围绕该方面词的不同范围的上下文单词,采用移动掩码机制,首先计算每个单词相对于方面词的相对距离
d
i
,表示为:
[0014][0015]其中,
P
i
表示第
i
个单词的位置,
i
的范围从0到
n

P
a+1
表示方面词的起始位置;
[0016]步骤
S202
,为了对上下文相邻单词的各种组成进行建模,基于跨度大小阈值
L
构建
L+1
个相邻跨度,其范围为从0到
L。
在大小为
l∈[0

L]的跨度中,每个上下文单词的掩码向量定义为:
[0017][0018]其中
E∈R
d
是一向量,
O∈R
d
是零向量,
R
d
表示实数域
d
维向量

然后得到第
l
个相邻跨度表示如下所示:
[0019][0020]其中掩码矩阵由
n+1
个掩码向量组成;
[0021]步骤
S203
,相邻跨度增强表示通过相邻跨度表示和原始上下文表示
H
的拼接获得,然后通过共享线性变换映射回统一的
d
维语义空间,表示为:
[0022][0023]其中是线性变换层中的权重,
b1∈R
d
为偏置矩阵,

表示拼接运算

[0024]优选的,所述步骤
S30
的具体步骤如下:
[0025]步骤
S301
,使用从中类别标记转换的全局表示
C
l
∈R
d
,计算公式如下:
[0026][0027]其中
W2∈R
d
×
d

b2∈R
d
分别是线性变换层中的权重矩阵和偏置矩阵,激活函数
Tanh
表示为
f(
·
)

[0028]步骤
S302
,使用全局表示作为查询向量,相邻跨度增强,使用全局表示作为查询向量,相邻跨度增强表示作为键和值,构造基于全局表示的多视角注意力机制,建立句子的多视角情感表示,
Q
l
为查询,
K
l
为键,
V
l
为值,计算公式如下:
[0029]Q
l

W
Q
...

【技术保护点】

【技术特征摘要】
1.
一种基于多视角相邻跨度增强的方面级情感分类方法,其特征在于,包括以下步骤:步骤
S10
:构造基于
Bert
的句子语义信息表示模型,建立以方面词为导向的上下文表示;步骤
S20
:构造移动掩码机制,根据上下文单词与方面词的相对距离构造方面词的多个相邻跨度,生成多个相邻跨度增强的上下文表示;步骤
S30
:提取每个相邻跨度增强上下文表示中分类符构造对应的全局表示,构造基于全局表示的多视角注意力机制,建立句子的多视角情感表示;步骤
S40
:利用全局平均池化层结合多视角情感表示形成综合情感表示,实现句子情感极性的预测
。2.
根据权利要求1所述的基于多视角相邻跨度增强的方面级情感分类方法,其特征在于:所述步骤
S10
的具体步骤如下:步骤
S101
,句子原始表示为
S

{w1,


w
n
}

n
为句子中单词的数量,其中方面词表示为
A

{w
a+1



w
a+m
}
,其中
a+1
为方面词中第一个单词在句子中的位置,
m
为方面词的单词数量,使用预训练语言模型
BERT
将句子
S
映射到输入向量其中包括一个类别标记和
n
个单词标记,
d
是输入向量的嵌入维数,将句子方面词对构造为“[CLS]
句子
[SEP]
方面
[SEP]”作为
BERT
编码器的输入,得到以方面词为导向的句子上下文表示
H

{h
CLS

h1,


h
n
}。3.
根据权利要求1所述的基于多视角相邻跨度增强的方面级情感分类方法,其特征在于:所述步骤
S20
的具体步骤如下:步骤
S201
,构建多个内聚单元,称为相邻跨度,以对方面词之前和之后的单词和方面词本身进行建模,不同的相邻跨度包含围绕该方面词的不同范围的上下文单词,采用移动掩码机制,首先计算每个单词相对于方面词的相对距离
d
i
,表示为:其中,
P
i
表示第
i
个单词的位置,
i
的范围从0到
n

P
a+1
表示方面词的起始位置;步骤
S202
,为了对上下文相邻单词的各种组成进行建模,基于跨度大小阈值
L
构建
L+1
个相邻跨度,其范围为从0到
L
,在大小为
l∈[0

L]
的跨度中,每个上下文单词的掩码向量定义为:其中
E∈R
d
是一向量,
O∈R
d
是零向量,
R
d
表示实数域
d
维向量,然后得到第
l
个相邻跨度表示如下所示:其中掩码矩阵由
n+1
个掩码向量组成;
步骤
S203
,相邻跨度增强表示通过相邻跨度表示和原始上下文表示
H
的拼接获得,然后通过共享线性变换映射回统一的
d
维语义空间,表示为:其中是线性变换层中的权重,
b1∈R
d
为偏置...

【专利技术属性】
技术研发人员:刘峤刘雪怡赵海睿钟诣哲侯睿甘洋镭代婷婷佟飘
申请(专利权)人:电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1