情感分析模型训练方法、装置、存储介质及电子设备制造方法及图纸

技术编号:44897746 阅读:45 留言:0更新日期:2025-04-08 00:38
本申请公开了一种情感分析模型训练方法、装置、存储介质及电子设备,涉及人工智能技术领域。其中方法包括:确定原始文本集合中属于少数情感类别的目标样本;若目标样本的数量比例小于预设比例,则提取目标样本的上下文文本,以确定增强样本,并将增强样本和原始文本集合共同作为训练样本;确定初始情感分析模型和不同情感类别对应的目标类别权重;将训练样本输入至初始情感分析模型中进行基于方面的情感分析,得到训练样本的预测情感类别;基于训练样本的预测情感类别和真实情感类别,以及不同情感类别对应的目标类别权重,计算加权交叉熵损失函数值,以对初始情感分析模型进行迭代训练。本申请能够解决情感分析模型训练过程中类别不平衡的问题。

【技术实现步骤摘要】

本申请涉及人工智能,尤其是涉及到一种情感分析模型训练方法、装置、存储介质及电子设备


技术介绍

1、情感分析的基本任务是从文本中提取和识别情感信息,随着bert等预训练语言模型的崛起,情感分析技术取得了显著突破。

2、目前,在情感分析任务中,通常采用不同情感类别的样本,训练情感分析模型。然而,样本训练集中不同情感类别的样本数量会存在类别不平衡的问题,例如,负面和中性情感类别的样本数量通常少于正面情感类别的样本数量,这种不平衡会导致模型在训练过程中对少数类别学习不足,倾向于预测多数类别,从而影响情感分析模型的整体分类性能,无法保证情感分类精度。


技术实现思路

1、有鉴于此,本申请提供了一种情感分析模型训练方法、装置、存储介质及电子设备,主要目的在于能够解决情感分析模型训练过程中类别不平衡的问题,从而能够提高模型的情感分类精度。

2、依据本申请的第一方面,提供了一种情感分析模型训练方法,该方法包括:

3、确定原始文本集合中属于少数情感类别的目标样本,以及所述目标样本在所述原始文本文档来自技高网...

【技术保护点】

1.一种情感分析模型训练方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述确定所述上下文文本与所述目标样本之间的语义相关度,包括:

3.根据权利要求1所述的方法,其特征在于,在所述确定原始文本集合中属于少数情感类别的目标样本,以及所述目标样本在所述原始文本集合中的数量比例之前,所述方法还包括:

4.根据权利要求1所述的方法,其特征在于,所述初始情感分析模型包括分类层和双向编码器预训练模型中的输入层和编码层,将所述训练样本输入至所述初始情感分析模型中进行基于方面的情感分析,得到所述训练样本的预测情感类别,包括:</p>

5.根据...

【技术特征摘要】

1.一种情感分析模型训练方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述确定所述上下文文本与所述目标样本之间的语义相关度,包括:

3.根据权利要求1所述的方法,其特征在于,在所述确定原始文本集合中属于少数情感类别的目标样本,以及所述目标样本在所述原始文本集合中的数量比例之前,所述方法还包括:

4.根据权利要求1所述的方法,其特征在于,所述初始情感分析模型包括分类层和双向编码器预训练模型中的输入层和编码层,将所述训练样本输入至所述初始情感分析模型中进行基于方面的情感分析,得到所述训练样本的预测情感类别,包括:

5.根据权利要求4所述的方法,其特征在于,所述将所述标记后的训练样本输入至所述输入层进行处理,得到所述标记后的训练样本对应的嵌入向...

【专利技术属性】
技术研发人员:夏演潘壮壮罗金光夏瑜蒋玉峰朱峰
申请(专利权)人:常熟理工学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1