一种中文对话方面级情感分析方法及系统技术方案

技术编号:39657221 阅读:15 留言:0更新日期:2023-12-09 11:26
本发明专利技术公开一种中文对话方面级情感分析方法及系统,涉及自然语言处理技术领域,方法包括:构建第一问题句式

【技术实现步骤摘要】
一种中文对话方面级情感分析方法及系统


[0001]本专利技术涉及自然语言处理
,特别是涉及一种中文对话方面级情感分析方法及系统


技术介绍

[0002]随着电子商务的快速发展,商家越来越意识到通过消费者在线评论对各种产品和服务的观点和意见的好处

根据
Power Reviews

2010
年的一项调查,
64
%的在线购物者会花费超过
10
分钟的时间关注评论,
68
%的在线购物者在做出购买决定前会至少阅读四个产品评论

像淘宝

京东这样的网站不仅有利于商家的销售,也为销售者提供了一个分享他们对产品的意见和看法的平台

在消费者评论中蕴含着大量关于期望和情感极性的情感信息

不仅可以帮助消费者有效的选择产品和服务的关键参考,商家还可以收集在线评论
(
如笔记本的重量和外观

餐厅服务质量和食物的价格等
)
,用以仔细了解消费者的期望,作为营销决策中的关键驱动因素

因此,利用完整的情感分析来从消费者评论中提取重要的细粒度信息十分有必要

[0003]近年来,情感分析在自然语言处理领域引起了广泛的关注

从文本处理角度看,可以分为粗粒度和细粒度情感分析

细粒度情感分析又称为方面级情感分析
(ABSA)
,顾名思义,是更加精细

全面的情感分析

由于当前
ABSA
的工作大都局限于单文本的片段场景,因此诞生了一项更加新且完整的任务,对话方面级情感分析
(CASA)。
对话方面情感分析
(
对话方面级情感分析
)
主要的任务是从对话中抽取出现过的目标词和情感词并结合语境分析出对应的情感极性

目标词指的是讨论的对象,可以是人或物,如一部电影

小米手机

某个演员等

情感词就是表达情感的词,一般都是有对应的目标词,对讨论的对象表达出自己的观点

情感极性也就是我们的观点是积极的

消极的还是中立的

下面以一个对话例子进行说明:
[0004]A
:你知道在河南固始出过哪些明星吗?
[0005]B
:不知道,我的祖籍就是河南固始的

[0006]A
:周耀武很优秀

[0007]B
:原来他是河南固始的,我听说过他

[0008]A
:那他导演的一部电影你应该也看过了,
290.0
万票房的那部

[0009]B
:我没怎么关注过他的电影,你有资源的话可以推荐给我

[0010]A
:惊魂游戏!有评论说,因两位大侠武功烂得极为相似,江湖人称北孤岛,南惊魂

[0011]B
:那我等周末看一下吧

[0012]如上述这个对话,目标词有两个,“周耀武”和“两位大侠武功”,对应的情感词有“很优秀”和“烂”,这两个情感词的情感极性分别为积极的和消极的

[0013]过去的研究认为目标词和情感词的抽取是两个独立的任务
。Song
等人设计了一种管道方法
(pipeline)
,首先利用
RoBERTa
作为
Encoder
,和
MLP
层完成序列标注任务,识别出情感词和其对应的情感极性,然后将情感词
(opinion)
与对话进行拼接,也利用
RoBERTa


Encoder
,然后利用特征抽取器与
Encoder
输出进行融合,之后经过两个
attention
层分别计算出目标词的起始位置和结束位置的分布,从而完成目标词
(target)
的抽取

[0014]之前
Song
等人设计的一种
pipeline
的模型将整个
CASA
任务分解成多阶段的任务
(pipeline)
,模型每阶段都得到对应阶段任务的输出
(
可以看成多个模型,每阶段一个单独的模型
)
,虽然上面的模型可以很好的解决这个任务,但是管道方法需要将多个模型串联起来,每个模型的输出都会影响后续模型的输入,如果某个模型输出错误,会影响后续模型的性能,从而导致整个系统的性能的下降

[0015]综上,传统管道法模型处理对话方面级情感分析存在以下不足:管道方法的整体性能和效率低,管道法存在错误传播问题,因此传统管道法模型处理对话方面级情感分析无法高效

准确实现对话方面级情感分析


技术实现思路

[0016]本专利技术的目的是提供一种中文对话方面级情感分析方法及系统,能够高效

准确实现对话方面级情感分析

[0017]为实现上述目的,本专利技术提供了如下方案:
[0018]一种中文对话方面级情感分析方法,所述方法包括:
[0019]获取训练集;所述训练集包括多个对话样本以及每个所述对话样本对应的标签;所述对话样本包括多个句子;所述标签包括目标词标签

所述目标词标签对应的情感词标签以及所述情感词标签对应的情感极性标签;所述情感极性包括积极的

消极的和中立的;
[0020]构建第一问题句式;所述第一问题句式包括有哪些目标词;
[0021]根据所述第一问题句式,利用基于预训练语言模型的机器阅读理解预测出每个所述对话样本中的目标词;
[0022]对每个所述对话样本中的每一个目标词均构建第二问题句式;所述第二问题句式包括有哪些情感词对于目标词;
[0023]根据所述第二问题句式,利用基于预训练语言模型的机器阅读理解预测出每个所述对话样本中的目标词对应的情感词;
[0024]根据每个所述对话样本中的目标词对应的情感词,利用胶囊网络预测出每个所述对话样本中的情感词对应的情感极性;
[0025]根据所述标签

每个所述对话样本中的目标词

每个所述对话样本中的目标词对应的情感词以及每个所述对话样本中的情感词对应的情感极性,得到组合损失函数;所述组合损失函数包括目标词预测的损失函数

情感词预测的损失函数以及情感极性预测的损失函数;
[0026]利用所述组合损失函数对所述预训练本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种中文对话方面级情感分析方法,其特征在于,所述方法包括:获取训练集;所述训练集包括多个对话样本以及每个所述对话样本对应的标签;所述对话样本包括多个句子;所述标签包括目标词标签

所述目标词标签对应的情感词标签以及所述情感词标签对应的情感极性标签;所述情感极性包括积极的

消极的和中立的;构建第一问题句式;所述第一问题句式包括有哪些目标词;根据所述第一问题句式,利用基于预训练语言模型的机器阅读理解预测出每个所述对话样本中的目标词;对每个所述对话样本中的每一个目标词均构建第二问题句式;所述第二问题句式包括有哪些情感词对于目标词;根据所述第二问题句式,利用基于预训练语言模型的机器阅读理解预测出每个所述对话样本中的目标词对应的情感词;根据每个所述对话样本中的目标词对应的情感词,利用胶囊网络预测出每个所述对话样本中的情感词对应的情感极性;根据所述标签

每个所述对话样本中的目标词

每个所述对话样本中的目标词对应的情感词以及每个所述对话样本中的情感词对应的情感极性,得到组合损失函数;所述组合损失函数包括目标词预测的损失函数

情感词预测的损失函数以及情感极性预测的损失函数;利用所述组合损失函数对所述预训练语言模型和所述胶囊网络进行联合训练,得到联合训练后的预训练语言模型和联合训练后的胶囊网络;获取待预测对话;根据所述第一问题句式,利用基于联合训练后的预训练语言模型的机器阅读理解预测出所述待预测对话中的目标词;对所述待预测对话中的每一个目标词均构建第二问题句式;根据所述第二问题句式,利用基于联合训练后的预训练语言模型的机器阅读理解预测出所述待预测对话中的目标词对应的情感词;根据所述待预测对话中的目标词对应的情感词,利用联合训练后的胶囊网络预测出所述待预测对话中的情感词对应的情感极性
。2.
根据权利要求1所述的中文对话方面级情感分析方法,其特征在于,所述预训练语言模型为预训练模型
RoBERta。3.
根据权利要求1所述的中文对话方面级情感分析方法,其特征在于,所述组合损失函数其中,
α1,
α2,
α3∈[0,1]
是控制总损失目标的三个超参数,是组合损失函数,是目标词预测的损失函数,是情感词预测的损失函数,是情感极性预测的损失函数
。4.
根据权利要求1所述的中文对话方面级情感分析方法,其特征在于,所述目标词预测的损失函数

所述情感词预测的损失函数和所述情感极性预测的损失函数均为交叉熵损失函数
。5.
一种中文对话方面级情感分析系统,其特征在于,所述系统包括:训练集获取模块,用于获取训练集;所述训练集包括多个对话样本以及每个所述对话
样本对应的标签;所述对话样本...

【专利技术属性】
技术研发人员:宋霞文张华贾孝辉杨成谢波陈碧姜波
申请(专利权)人:浙江工商大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1