【技术实现步骤摘要】
一种中文对话方面级情感分析方法及系统
[0001]本专利技术涉及自然语言处理
,特别是涉及一种中文对话方面级情感分析方法及系统
。
技术介绍
[0002]随着电子商务的快速发展,商家越来越意识到通过消费者在线评论对各种产品和服务的观点和意见的好处
。
根据
Power Reviews
在
2010
年的一项调查,
64
%的在线购物者会花费超过
10
分钟的时间关注评论,
68
%的在线购物者在做出购买决定前会至少阅读四个产品评论
。
像淘宝
、
京东这样的网站不仅有利于商家的销售,也为销售者提供了一个分享他们对产品的意见和看法的平台
。
在消费者评论中蕴含着大量关于期望和情感极性的情感信息
。
不仅可以帮助消费者有效的选择产品和服务的关键参考,商家还可以收集在线评论
(
如笔记本的重量和外观
、
餐厅服务质量和食物的价格等
)
,用以仔细了解消费者的期望,作为营销决策中的关键驱动因素
。
因此,利用完整的情感分析来从消费者评论中提取重要的细粒度信息十分有必要
。
[0003]近年来,情感分析在自然语言处理领域引起了广泛的关注
。
从文本处理角度看,可以分为粗粒度和细粒度情感分析
。
细粒度情感分析又称为方面级情感分析
(ABS ...
【技术保护点】
【技术特征摘要】
1.
一种中文对话方面级情感分析方法,其特征在于,所述方法包括:获取训练集;所述训练集包括多个对话样本以及每个所述对话样本对应的标签;所述对话样本包括多个句子;所述标签包括目标词标签
、
所述目标词标签对应的情感词标签以及所述情感词标签对应的情感极性标签;所述情感极性包括积极的
、
消极的和中立的;构建第一问题句式;所述第一问题句式包括有哪些目标词;根据所述第一问题句式,利用基于预训练语言模型的机器阅读理解预测出每个所述对话样本中的目标词;对每个所述对话样本中的每一个目标词均构建第二问题句式;所述第二问题句式包括有哪些情感词对于目标词;根据所述第二问题句式,利用基于预训练语言模型的机器阅读理解预测出每个所述对话样本中的目标词对应的情感词;根据每个所述对话样本中的目标词对应的情感词,利用胶囊网络预测出每个所述对话样本中的情感词对应的情感极性;根据所述标签
、
每个所述对话样本中的目标词
、
每个所述对话样本中的目标词对应的情感词以及每个所述对话样本中的情感词对应的情感极性,得到组合损失函数;所述组合损失函数包括目标词预测的损失函数
、
情感词预测的损失函数以及情感极性预测的损失函数;利用所述组合损失函数对所述预训练语言模型和所述胶囊网络进行联合训练,得到联合训练后的预训练语言模型和联合训练后的胶囊网络;获取待预测对话;根据所述第一问题句式,利用基于联合训练后的预训练语言模型的机器阅读理解预测出所述待预测对话中的目标词;对所述待预测对话中的每一个目标词均构建第二问题句式;根据所述第二问题句式,利用基于联合训练后的预训练语言模型的机器阅读理解预测出所述待预测对话中的目标词对应的情感词;根据所述待预测对话中的目标词对应的情感词,利用联合训练后的胶囊网络预测出所述待预测对话中的情感词对应的情感极性
。2.
根据权利要求1所述的中文对话方面级情感分析方法,其特征在于,所述预训练语言模型为预训练模型
RoBERta。3.
根据权利要求1所述的中文对话方面级情感分析方法,其特征在于,所述组合损失函数其中,
α1,
α2,
α3∈[0,1]
是控制总损失目标的三个超参数,是组合损失函数,是目标词预测的损失函数,是情感词预测的损失函数,是情感极性预测的损失函数
。4.
根据权利要求1所述的中文对话方面级情感分析方法,其特征在于,所述目标词预测的损失函数
、
所述情感词预测的损失函数和所述情感极性预测的损失函数均为交叉熵损失函数
。5.
一种中文对话方面级情感分析系统,其特征在于,所述系统包括:训练集获取模块,用于获取训练集;所述训练集包括多个对话样本以及每个所述对话
样本对应的标签;所述对话样本...
【专利技术属性】
技术研发人员:宋霞文,张华,贾孝辉,杨成,谢波,陈碧,姜波,
申请(专利权)人:浙江工商大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。