情感分析方法、装置、计算机设备以及存储介质制造方法及图纸

技术编号:43716101 阅读:26 留言:0更新日期:2024-12-18 21:30
本发明专利技术涉及自然语言处理技术领域,特别涉及一种情感分析方法、装置、计算机设备以及存储介质,基于源语言集以及目标语言集的预测情感概率分布集,对教师模型进行训练,获得训练后的教师模型以及预设的学生模型输出的目标语言未标记句子集的预测情感概率分布集,作为学生模型的训练数据,采用知识蒸馏方法,对学生模型进行训练,提高了学生模型执行跨语言方面级情感分类任务的准确率,从而实现基于目标语言的方面词的提取以及方面词的情感极性的确认,提高了情感分析的准确性。

【技术实现步骤摘要】

本专利技术涉及自然语言处理,特别涉及一种情感分析方法、装置、计算机设备以及存储介质


技术介绍

1、基于方面级的情感分析(absa)涉及识别句子中的特定方面术语及其情感极性。基于已标注的大型语料库上,absa 的研究在英文文本上取得了成功,但现实世界的社交媒体交互通常涉及多种语言,突出了跨语言情感分析的需要。

2、在跨语言的方面级情感分析中,每个方面词的情感都根据一组预定义的情感极性进行分类,即积极、中性或消极,其任务旨在使得模型在源语言标记数据集上进行训练,然后在目标语言的未标注数据集上进行预测。由于为低资源语言获取大量带注释的训练数据非常昂贵,早期的跨语言情感分析工作仅依靠来自不同源语言的注释数据来学习目标语言的情感分类。这些模型通常依赖于双语词典、预训练的跨语言词嵌入或机器翻译来弥合源语言和目标语言之间的差距。

3、目前的技术方案通常利用多语言预训练模型对对齐的翻译数据进行微调,对跨语言方面词一致性进行对齐,以弥合源语言和目标语言之间的差距。然而,上述技术方案尽管有相关工作从句子级层面上对源语言和目标语言进行对齐,在实际应用中本文档来自技高网...

【技术保护点】

1.一种情感分析方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的情感分析方法,其特征在于,还包括步骤:对所述编码模型进行训练;

3.根据权利要求1或2所述的情感分析方法,其特征在于,所述根据所述源语言集以及目标语言集的预测情感概率分布集,对预设的教师模型进行训练,获得目标教师模型,包括步骤:

4.根据权利要求3所述的情感分析方法,其特征在于:所述目标教师模型包括若干个子教师模型;

5.根据权利要求4所述的情感分析方法,其特征在于,所述根据所述目标教师模型以及学生模型输出的所述目标语言未标记句子集的预测情感概率分布集,对所述学生模型...

【技术特征摘要】

1.一种情感分析方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的情感分析方法,其特征在于,还包括步骤:对所述编码模型进行训练;

3.根据权利要求1或2所述的情感分析方法,其特征在于,所述根据所述源语言集以及目标语言集的预测情感概率分布集,对预设的教师模型进行训练,获得目标教师模型,包括步骤:

4.根据权利要求3所述的情感分析方法,其特征在于:所述目标教师模型包括若干个子教师模型;

5.根据权利要求4所述的情感分析方法,其特征在于,所述根据所述目标教师模型以及学生模型输出的所述目标语言未标记句子集的预测情感概率分布集,对所述学生模型进行训练,获得...

【专利技术属性】
技术研发人员:薛云吴承彦蔡倩华
申请(专利权)人:华南师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1