一种基于位置增强的细粒度情感分析方法技术

技术编号:31021775 阅读:46 留言:0更新日期:2021-11-30 03:11
本发明专利技术提出了一种基于位置增强的细粒度情感分析方法,用于解决现有技术对文本进行细粒度情感分析导致的精度低的问题。首先将文本进行预处理,再通过细粒度情感分析模型进行情感分析。模型包括嵌入层、语义表征层、信息交互层和输出层。嵌入层将句子映射为上下文词嵌入和方面词嵌入,语义表征层通过位置强化注意力机制来增强模型的文本语义表征能力,信息交互层通过使用记忆网络增强方面词与其上下文的交互性,将基于方面的上下文语义增强表示作为与方面交互的外部记忆单元,使得外部存储记忆单元能够学习到复杂文本中的语义信息,最后输出层进行情感预测。本发明专利技术通过合理界定对方面进行情感表达的上下文范围,提高了细粒度情感分析准确度。分析准确度。分析准确度。

【技术实现步骤摘要】
一种基于位置增强的细粒度情感分析方法


[0001]本专利技术属于信息处理
,是一种基于位置增强的细粒度情感分析方法。

技术介绍

[0002]社交网络和电商购物平台的迅速发展使得人们可以更方便的在网络平台上发表观点和表达意见,从而产生大量的包含用户情感信息的文本数据,蕴含着巨大的实用价值。而产品具有多维属性,消费者会从不同角度对产品和服务发表评论,如质量、价格和服务等方面。传统的文本情感分析技术通常是在整体上给出一个情感判断,无法满足在评论文本中对不同方面进行情感倾向性判断的需求,所以文本的情感分析粒度需要更加细化。例如句子“这家餐厅的食物太好吃了,但服务质量比较差。”,细粒度情感分析任务旨在判断方面“食物”和“服务”的情感倾向(食物,正面)和(服务,负面)。例句中的“食物”和“服务”称作方面,而不属于方面的其他文本“这家餐厅的太好吃了,但质量比较差。”称为上下文。该任务是自然语言处理领域中的热门研究方向,其有助于消费者的选择与企业在产品方面的决策,有着广泛的商业前景和应用价值。
[0003]随着深度学习技术不断趋于成熟,在文本情感本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于位置增强的细粒度情感分析方法,其特征在于包括以下步骤:步骤1文本预处理;步骤2词向量构建:将预处理后的文本数据中的每一个词映射到向量空间,得到每个词的词向量;步骤3利用细粒度情感分析模型对待分析文本进行方面级情感的细粒度情感预测,其中细粒度情感分析模型包括嵌入层、语义表征层、信息交互层和输出层,具体预测过程为:首先,嵌入层根据步骤2得到的词向量,将文本中的句子映射为上下文词嵌入和方面词嵌入表示;然后,语义表征层对上下文词嵌入使用自注意力机制,再通过方面词位置信息强化注意力机制来增强模型的文本语义表征能力;接下来,通过信息交互层增强方面词与其上下文的交互性;最后,输出层进行方面词的情感预测。2.根据权利要求1所述的一种基于位置增强的细粒度情感分析方法,其特征在于:步骤1所述文本预处理包括如下步骤:(1)大小写转换:将存在的所有大写字母转换为小写字母;(2)分词:采用通用的语言分词模块对文本数据进行分词;(3)去除停用词:去除文本数据中一些没有实际意义的词;(4)利用屏蔽机制对文本数据构造位置权重矩阵M,计算公式如下:其中h
max
表示为输入句子的最大长度,所述的屏蔽机制根据句子中方面词与上下文词的相对位置计算其位置权重,M
ij
表示以方面词w
i
为中心的词对的位置权重,i和j为词的位置索引,词对距离在h
max
/2内时,根据距离的大小赋予权重,否则将M
ij
设定为0。3.根据权利要求1所述的一种基于位置增强的细粒度情感分析方法,其特征在于包括以下步骤:步骤2中所述词向量的获取方式为:对文本数据中的每一个词,若该词在预训练的词向量表中存在,则使用词向量表中的词向量作为该词的词向量,若该词在预训练词向量表中不存在,则使用正态分布随机初始化向量作为该词的词向量。4.根据权利要求1所述的一种基于位置增强的细粒度情感分析方法,其特征在于:所述细粒度情感分析模型每个层的具体步骤如下:嵌入层根据步骤2得到所有词的词向量,将文本中的句子映射为低维稠密向量形式的词嵌入表示,已经标记方面的句子看作由方面和方面的上下文构成,相应的词嵌入表示分为上下文词嵌入和方面词嵌入,如果一个方面由多个词构成,则将多个词的向量表示进行平均池化作为方面的向量表示;语义表征层用于提取文本的高度抽象表示,语义表征层的网络具体结构由K个Block通过串联组成,通过不断迭代计算,从而得到文本的更深层次的抽象特征H,其中每个Block在注意力机制中加入了位置权重,并使用残差连接、层归一化和前馈神经网络层处理;
信息交互层使用记忆网络进行交互,用于增强抽象特征H与方面之间的联系,保证方面和其上下文具有交互性;记忆网络以语义表征层得到的抽象文本特征H=[h1,h2,

,h
n
]作为记忆单元,由L个计算层组成,第1个计算层以方面词嵌入v
aspect
作为初始输入,以记忆单元的加权组合r作为输出,其输出作为下一个计算层的输入,每层依次迭代计算,加权组合公式如下:其中n为记忆容量大小,α
i
∈[0,1]是记忆单元h
i
的权重且∑
i=1
α
i
=1,权重α
i
通过前馈神经网络计算方面与上下文的语义相关性得到,计算如下所示:ω
i
=tanh(W
att
[h
i
;v
aspect
]+b
att
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(公式3)其中W
att
∈R1×
2n
为参数向量,b
att
∈R1×1为偏置,α
i
为记忆单元h
i
的权值分配;输出层以信息交互层的结果为输入,利用softmax函数预测方面情感。5.根据权利要求4所述的一种基于位置增强的细粒度情感分析方法,其特征在于包括以下步骤:步骤3中所述语义表征层的Block设计如下:(1)使用自注意力机制:上下文词嵌入E被线性映射到三个不同的空间,得到对应的查询矩阵Q、键矩阵K和值矩...

【专利技术属性】
技术研发人员:刘磊侯良文焦一狄李静
申请(专利权)人:北京工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1