一种基于BERT对抗训练的比较句情感分析方法及系统技术方案

技术编号：34555876 阅读：30 留言：0更新日期：2022-08-17 12:41

本发明专利技术公开了一种基于BERT对抗训练的比较句情感分析方法及系统，通过将预训练语言模型BERT与对抗训练过程相结合，从而创新地获取评论文本中更加丰富的语义特征信息，并降低数据集中大量的非比较句所带来的噪声影响，提升对于比较句情感分析的性能。本发明专利技术通过引入预训练语言模型BERT对输入的评论文本进行编码，有效地识别比较句文本中的深层语义以及逻辑关系；通过引入对抗训练过程，可以降低数据集中大量的非比较句带来的干扰，并且可以识别出比较句中数据样本较小的“WORSE”类别的文本，从而有效地预测出评论中的情感倾向。本发明专利技术在真实数据集上进行的广泛实验，证实了与最先进的模型相比本发明专利技术具有更加良好的性能。的模型相比本发明专利技术具有更加良好的性能。的模型相比本发明专利技术具有更加良好的性能。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于BERT对抗训练的比较句情感分析方法及系统

[0001]本专利技术属于比较句识别
，涉及一种基于BERT对抗训练的比较句情感分析方法及系统。

技术介绍

[0002]近年来，随着互联网迅速发展以及社会化媒体的日益普及，网购用户数目逐年递增，越来越多的用户愿意在网站上对商品进行评论。这些评论承载用户对产品的使用感受以及建议，蕴含着大量有价值的信息。不仅可以为其他消费者提供参考，也可以为商家提供改进建议。但是由于网络信息过载等问题，用户无法没有时间充分阅读浏览全部的评论，而且还有可能会被大量的信息干扰信息所影响，无法在短时间内对商品的质量或者购买倾向做出正确有效的决策。特别是在用户评论中存在着一些比较或者对比的评论，这种比较句通常表达多个实体之间关于某种属性特征的优先偏好排序的情况，这些比较评论不仅可以帮助消费者快速做出有效的判断，还可以帮助商家更直观的发现其与竞争对手间的差距并做出相应的改进。因此，近年来如何对用户评论中的比较句进行情感分析，判断出评论者更倾向于哪一个比较实体已成为电商界和学术界中需要迫切解决的关键性问题之一。
[0003]现有的比较句识别方法首先从句子中提取比较句的句法结构特征，然后使用机器学习方法对提取到的特征进行有监督学习。而比较句情感分析则是在比较句识别的基础上，进一步使用标签序列标注(LSR)、语义角色标注、CRF等方法判别比较句中对实体的情感倾向与优先排序。由于比较句中的情感分析任务需要判断出评论者在两个比较实体对象之间更倾向于哪一个对象，...

【技术保护点】

【技术特征摘要】
1.一种基于BERT对抗训练的比较句情感分析方法，其特征在于，包括以下步骤：使用预训练语言模型BERT对输入的评论文本与评论中的两个比较对象进行编码；对编码后的评论文本进行对抗训练，得到文本语义信息、上下文依赖关系以及逻辑关系；依据文本语义信息、上下文依赖关系以及逻辑关系，利用Softmax函数获得最终比较句情感概率分布，并计算损失。2.根据权利要求1所述的基于BERT对抗训练的比较句情感分析方法，其特征在于，所述使用预训练语言模型BERT对输入的评论文本与评论中的两个比较对象进行编码，包括：采用预训练语言模型BERT对输入的评论文本S进行batch数据的编码，将要输入的评论文本S与评论中的两个比较对象表示为“[CLS]评论文本[SEP]比较对象1，比较对象2[SEP]”的格式；其中，用户的评论文本S＝{w1,w2,w3,...,w
n
‑1,w
n
}，评论中的比较对象{C＝c_obj1,c_obj2}，w
n
是评论中的单词；使用预训练语言模型BERT的最后一层输出作为输入的评论文本的隐藏层向量h
i
，H表示代表编码后隐藏层的维度，n表示输入的评论文本的序列长度。3.根据权利要求2所述的基于BERT对抗训练的比较句情感分析方法，其特征在于，所述对评论文本进行编码是采用预训练语言模型BERT的双句输入模式进行编码的。4.根据权利要求2所述的基于BERT对抗训练的比较句情感分析方法，其特征在于，所述对编码后的评论文本进行对抗训练，包括：每完成一对batch数据的编码，产生一个随机数τ，若随机数τ＜0.5开始对抗训练，所述随机数τ如下：τ＝random()
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)以迭代的方式根据梯度生成对抗干扰，当开始第一轮迭代时，则在预训练语言模型BERT的原始输入词嵌入的word_embedding的参数权重W
word
的基础上添加根据梯度得到的对抗扰动r
at
，得到当前迭代轮次添加干扰后的参数权重t
k
：t
k
＝W
word
+r
at
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)其中，k为当前迭代轮次；θ为参数；G为梯度，||G||为梯度的范数，使对抗扰动r
at
的方向与梯度G一致；通过阈值ε控制添加干扰后的文本语义与原文本语义的差异性d，若差异性d的范数大于阈值ε，则使用截断器Chopper对差值进行截断：d＝t
‑
W
word
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)其中，g表示最终通过截断器后所确定的当前轮次的对抗干扰；当前迭代轮次的word_embedding的参数权重O
k
为：O
k
＝W
word
+g
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ...

【专利技术属性】
技术研发人员：饶元，谢尚汝，张祎彬，夏昺灿，
申请(专利权)人：西安交通大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人