基于对比学习的情感分析方法、装置、设备以及存储介质制造方法及图纸

技术编号:37131189 阅读:8 留言:0更新日期:2023-04-06 21:29
本发明专利技术涉及情感分析领域,特别涉及一种基于对比学习的情感分析方法、装置、设备以及存储介质,通过引入依存信息以及词性信息,构建若干个样本语句的正例以及负例,利用对比学习方法加强语句中的信息,并结合若干个样本语句的情感极性,利用对比学习方法以兼顾语义特征以及句法特征的一致性和均匀性,更加全面地对语句进行情感分析,提升了情感分析的准确性以及效率。及效率。及效率。

【技术实现步骤摘要】
基于对比学习的情感分析方法、装置、设备以及存储介质


[0001]本专利技术涉及情感分析领域,特别涉及一种基于对比学习的情感分析方法、装置、设备以及存储介质。

技术介绍

[0002]方面级情感分类是自然语言处理中一个重要任务,旨在识别一个句子中给定的方面词的情感极性(积极,中性,消极)。
[0003]目前基于神经网络的方法已广泛应用于方面级情感分类任务,一些采用基于注意力机制的方法,期望能够帮助模型捕获到有利于情感极性判断的词语。然而注意力机制仅根据语义特征可能错误地关注无关上下文词语,特别是包含多个方面词的句子中,复杂的语义结构往往会迷惑模型,从而导致模型做出错误的情感极性判断。近些年来图卷积神经网络的广泛应用,将句法依存信息融入模型中,并取得出色的效果,进一步说明了句法结构信息的引入,能够有效缓解注意力机制的不足和解决循环神经网络存在的长距离依赖问题。后来的方法开始思考将句法信息和语义信息同时结合起来,多通道的图卷积神经网络开始应用于方面级情感分类任务中。
[0004]尽管这一类的方法相较于仅利用句法图神经网络的方法能取得更好的效果,但依然存在以下问题:1、构造的句法解析结果往往是针对整个句子进行句法解析,没有考虑特定的方面词或者一些对情感极性判断有帮助的观点词的重要性,这样的做法容易在特征提取阶段引入额外的冗余信息;2、此外,目前的做法往往是将语义和语法视为两种空间的特征,并分别提取和融合语法特征和语义特征,最后简单拼接后送入分类层,但是却忽略了对语法特征和语义特征一致性/对齐性(alignment)和均匀性(uniformity)的讨论,难以对语句进行准确的情感分析。

技术实现思路

[0005]基于此,本专利技术提供一种基于对比学习的情感分析方法、装置、设备以及存储介质,通过引入依存信息以及词性信息,构建若干个样本语句的正例以及负例,利用对比学习方法加强语句中的信息,并结合若干个样本语句的情感极性,利用对比学习方法以兼顾语义特征以及句法特征的一致性和均匀性,更加全面地对语句进行情感分析,提升了情感分析的准确性以及效率。该技术方法如下:
[0006]第一方面,本申请实施例提供了一种基于对比学习的情感分析方法,包括以下步骤:
[0007]获取若干个样本语句、依存信息、词性信息以及情感标签集,其中,所述样本语句包括若干个单词以及方面词,所述依存信息为所述方面词与各个单词之间的依存类型标记信息,所述词性信息为所述若干个样本语句中若干个非方面词的词性标记信息,所述情感标签集包括所述若干个样本语句对应的真实情感概率分布向量;
[0008]获取预设的情感分类模型,所述情感分类模型包括句子编码网络、嵌入矩阵构建
网络、第一图卷积网络、第二图卷积网络、多层互双仿射网络以及全连接网络,将所述若干个样本语句输入至所述句子编码网络,获得所述若干个样本语句的句子特征表示;
[0009]根据所述依存信息,构建所述若干个样本语句的依存句法图,根据所述词性信息,构建所述若干个样本语句的正例表示序列以及负例表示序列;
[0010]将所述若干个样本语句的依存句法图、相应的正例表示序列以及负例表示序列输入至所述嵌入矩阵构建网络,获得所述若干个样本语句的嵌入矩阵,将所述若干个样本语句的嵌入矩阵分别与相应的所述正例表示序列以及负例表示序列相乘,获得所述若干个样本语句的正例嵌入矩阵以及负例嵌入矩阵;根据所述若干个样本语句的嵌入矩阵、正例嵌入矩阵以及负例嵌入矩阵,获得所述嵌入矩阵构建网络输出的第一损失值;
[0011]将所述若干个样本语句的句子特征表示输入至所述第一图卷积网络中进行图卷积处理,获得所述若干个样本语句的初始语义特征表示,将所述若干个样本语句的句子特征表示以及相应的嵌入矩阵输入至所述第二图卷积网络中进行图卷积处理,获得所述若干个样本语句的初始句法特征表示;
[0012]将所述若干个样本语句的初始语义特征表示以及初始句法特征表示输入至所述多层互双仿射网络中进行融合处理,获得所述若干个样本语句的融合语义特征表示以及融合句法特征表示;
[0013]将所述若干个样本语句的融合语义特征表示、融合句法特征表示输入至所述全连接网络中,获得所述若干个样本语句的预测情感概率分布向量,根据所述若干个样本语句的预测情感概率分布向量,获得所述若干个样本语句的情感极性;
[0014]将所述若干个样本语句的情感标签集输入至所述全连接网络,根据所述若干个样本语句的预测情感概率分布向量以及相应的真实情感概率分布向量,获得所述全连接网络输出的第二损失值;
[0015]将具有相同情感极性的所述若干个样本语句进行组合,获得若干个正例样本语句集,根据所述若干个正例样本语句集对应的若干个样本语句的融合语义特征表示以及融合句法特征表示,获得所述全连接网络输出的第三损失值以及第四损失值;
[0016]根据所述第一损失值、第二损失值、第三损失值以及第四损失值,构建所述情感分类模型的总损失函数,结合所述总损失函数,对所述情感分类模型进行迭代训练,直到满足训练停止条件,获取训练好的情感分类模型;
[0017]获取待测语句,将所述待测语句输入至所述训练好的情感分类模型,获得所述待测语句的情感极性,作为所述待测语句的情感分析结果。
[0018]第二方面,本申请实施例提供了一种基于对比学习的情感分析装置,包括:
[0019]数据获取模块,用于获取若干个样本语句、依存信息、词性信息以及情感标签集,根据预设的批次,将所述若干个样本语句划分为若干个样本语句,其中,所述样本语句包括若干个单词以及方面词,所述依存信息为所述方面词与各个单词之间的依存类型标记信息,所述词性信息为所述若干个样本语句中若干个非方面词的词性标记信息,所述情感标签集包括所述若干个样本语句对应的真实情感概率分布向量;
[0020]句子信息提取模块,用于获取预设的情感分类模型,所述情感分类模型包括句子编码网络、嵌入矩阵构建网络、第一图卷积网络、第二图卷积网络、多层互双仿射网络以及全连接网络,将所述若干个样本语句输入至所述句子编码网络,获得所述若干个样本语句
的句子特征表示;
[0021]数据构建模块,用于根据所述依存信息,构建所述若干个样本语句的依存句法图,根据所述词性信息,构建所述若干个样本语句的正例表示序列以及负例表示序列;
[0022]第一损失值计算模块,用于将所述若干个样本语句的依存句法图、相应的正例表示序列以及负例表示序列输入至所述嵌入矩阵构建网络,获得所述若干个样本语句的嵌入矩阵,将所述若干个样本语句的嵌入矩阵分别与相应的所述正例表示序列以及负例表示序列相乘,获得所述若干个样本语句的正例嵌入矩阵以及负例嵌入矩阵;根据所述若干个样本语句的嵌入矩阵、正例嵌入矩阵以及负例嵌入矩阵,获得所述嵌入矩阵构建网络输出的第一损失值;
[0023]语法信息提取模块,用于将所述若干个样本语句的句子特征表示输入至所述第一图卷积网络中进行图卷积处理,获得所述若干个样本语句的初始语义特征表示,将所述若干个样本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于语句的情感分析方法,其特征在于,包括以下步骤:获取若干个样本语句、依存信息、词性信息以及情感标签集;其中,所述样本语句包括若干个单词以及方面词,所述依存信息为所述方面词与各个单词之间的依存类型标记信息,所述词性信息为所述若干个样本语句中若干个非方面词的词性标记信息,所述情感标签集包括所述若干个样本语句对应的真实情感概率分布向量;获取预设的情感分类模型;所述情感分类模型包括句子编码网络、嵌入矩阵构建网络、第一图卷积网络、第二图卷积网络、多层互双仿射网络以及全连接网络;将所述若干个样本语句输入至所述句子编码网络,获得所述若干个样本语句的句子特征表示;根据所述依存信息,构建所述若干个样本语句的依存句法图,根据所述词性信息,构建所述若干个样本语句的正例表示序列以及负例表示序列;将所述若干个样本语句的依存句法图、相应的正例表示序列以及负例表示序列输入至所述嵌入矩阵构建网络,获得所述若干个样本语句的嵌入矩阵,将所述若干个样本语句的嵌入矩阵分别与相应的所述正例表示序列以及负例表示序列相乘,获得所述若干个样本语句的正例嵌入矩阵以及负例嵌入矩阵;根据所述若干个样本语句的嵌入矩阵、正例嵌入矩阵以及负例嵌入矩阵,获得所述嵌入矩阵构建网络输出的第一损失值;将所述若干个样本语句的句子特征表示输入至所述第一图卷积网络中进行图卷积处理,获得所述若干个样本语句的初始语义特征表示;将所述若干个样本语句的句子特征表示以及相应的嵌入矩阵输入至所述第二图卷积网络中进行图卷积处理,获得所述若干个样本语句的初始句法特征表示;将所述若干个样本语句的初始语义特征表示以及初始句法特征表示输入至所述多层互双仿射网络中进行融合处理,获得所述若干个样本语句的融合语义特征表示以及融合句法特征表示;将所述若干个样本语句的融合语义特征表示、融合句法特征表示输入至所述全连接网络中,获得所述若干个样本语句的预测情感概率分布向量,根据所述若干个样本语句的预测情感概率分布向量,获得所述若干个样本语句的情感极性;将所述若干个样本语句的情感标签集输入至所述全连接网络,根据所述若干个样本语句的预测情感概率分布向量以及相应的真实情感概率分布向量,获得所述全连接网络输出的第二损失值;将具有相同情感极性的所述若干个样本语句进行组合,获得若干个正例样本语句集,根据所述若干个正例样本语句集对应的若干个样本语句的融合语义特征表示以及融合句法特征表示,获得所述全连接网络输出的第三损失值以及第四损失值;根据所述第一损失值、第二损失值、第三损失值以及第四损失值,构建所述情感分类模型的总损失函数,结合所述总损失函数,对所述情感分类模型进行迭代训练,直到满足训练停止条件,获取训练好的情感分类模型;获取待测语句,将所述待测语句输入至所述训练好的情感分类模型,获得所述待测语句的情感极性,作为所述待测语句的情感分析结果。2.根据权利要求1所述的基于语句的情感分析方法,其特征在于:所述句子特征表示集包括若干个样本语句的句子特征表示;所述将所述若干个样本语句的句子特征表示输入至所述第一图卷积网络中进行图卷
积处理,获得所述若干个样本语句的初始语义特征表示,包括步骤:根据所述若干个样本语句的句子特征表示以及预设的第一多头自注意力算法,获得所述若干个样本语句的第一注意力权重矩阵,其中,所述第一多头自注意力算法为:式中,A
sem
为所述样本语句的第一注意力权重矩阵,Softmax( )为归一化指数函数,H为所述样本语句的句子特征表示,W
q
为预设的第一可训练权重参数矩阵,W
k
为预设的第二可训练权重参数矩阵,d为第一多头自注意力的维度参数;根据所述若干个样本语句的第一注意力权重矩阵以及预设的语义特征计算算法,获得所述若干个样本语句的初始语义特征表示,其中,所述语义特征计算算法为:H
sem
=σ(A
sem
W
v
H+b)式中,H
sem
为所述样本语句的语义特征表示,σ( )为非线性激活函数,W
v
为预设的第三可训练权重参数矩阵,b为预设的第一偏置参数。3.根据权利要求2所述的基于语句的情感分析方法,其特征在于,所述将所述若干个样本语句的句子特征表示以及相应的嵌入矩阵输入至所述第二图卷积网络中进行图卷积处理,获得所述若干个样本语句的初始句法特征表示,包括步骤:根据所述若干个样本语句的句子特征表示、相应的嵌入矩阵以及预设的第二多头自注意力算法,获得所述若干个样本语句的第二注意力权重矩阵,其中,所述第二多头自注意力算法为:式中,att为所述样本语句的第二注意力权重矩阵,Softmax( )为归一化指数函数,A
syn
为所述样本语句的嵌入矩阵,H为所述样本语句的句子特征表示,W
t
为预设的第四可训练权重参数矩阵,W
h
为预设的第五可训练权重参数矩阵,d
m
为第二多头自注意力的维度参数;b
D
为预设的第二偏置参数,b
h
为预设的第三偏置参数;根据所述若干个样本语句的第二注意力权重矩阵以及预设的句法特征计算算法,获得所述若干个样本语句的初始句法特征表示,其中,所述句法特征计算算法为:H
syn
=att*H式中,H
syn
为所述样本语句的语义特征表示。4.根据权利要求3所述的基于语句的情感分析方法,其特征在于,所述将所述若干个样本语句的初始语义特征表示以及初始句法特征表示输入至所述多层互双仿射网络中进行融合处理,获得所述若干个样本语句的融合语义特征表示以及融合句法特征表示,包括步骤:将所述若干个样本语句的初始语义特征表示以及初始句法特征表示作为所述多层互双仿射网络的第一层的输入信息;根据所述多层互双仿射网络的第一层的输入信息以及预设的特征融合计算算法,获得所述多层互双仿射网络的最后一层输出的所述若干个样本语句的融合语义特征表示以及
融合句法特征表示,其中,所述特征融合计算算法为:融合句法特征表示,其中,所述特征融合计算算法为:式中,为所述互双仿射网络的第l层输出的样本语句的融合语义特征表示,为所述互双仿射网络的第l层输出的样本语句的融合句法特征表示,Softmax( )为归一化指数函数,为所述互双仿射网络的第l

1层对应的第一可学习参数,为所述互双仿射网络的第l

1层对应的第二可学习参数。5.根据权利要求4所述的基于语句的情感分析方法,其特征在于,所述将所述若干个样本语句的融合语义特征表示、融合句法特征表示输入至所述全连接网络中,获得所述若干个样本语句的预测情感概率分布向量,根据所述若干个样本语句的预测情感概率分布向量,获得所述若干个样本语句的情感极性,包括步骤:从所述若干个样本语句的融合语义特征表示、融合句法特征表示中,获取所述若干个样本语句的方面词的融合语义特征向量、融合句法特征向量,根据所述若干个样本语句的方面词的融合语义特征向量、融合句法特征向量以及预设的池化计算算法,获得池化处理后的所述若干个样本语句的融合语义特征表示以及融合句法特征表示,其中,所述池化计算算法为:算算法为:式中,为所述池化处理后的若干个样本语句的融合语义特征表示,为所述池化处理后的若干个样本语句的融合句法特征表示,为所述互双仿射网络的第l层输出的样本语句的方面词中第a个位置索引对应的单词的融合语义特征向量,为所述互双仿射网络的第l层输出的样本语句的第a个位置索引对应的单词的融合句法特征向量,a为所述方面词中单词的起始索引,l
a
为所述方...

【专利技术属性】
技术研发人员:熊浩良胡晓晖燕泽昊薛云
申请(专利权)人:华南师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1