【技术实现步骤摘要】
本申请涉及人工智能,尤其是涉及到一种情感分析模型训练方法、装置、存储介质及电子设备。
技术介绍
1、情感分析的基本任务是从文本中提取和识别情感信息,随着bert等预训练语言模型的崛起,情感分析技术取得了显著突破。
2、目前,在情感分析任务中,通常采用不同情感类别的样本,训练情感分析模型。然而,样本训练集中不同情感类别的样本数量会存在类别不平衡的问题,例如,负面和中性情感类别的样本数量通常少于正面情感类别的样本数量,这种不平衡会导致模型在训练过程中对少数类别学习不足,倾向于预测多数类别,从而影响情感分析模型的整体分类性能,无法保证情感分类精度。
技术实现思路
1、有鉴于此,本申请提供了一种情感分析模型训练方法、装置、存储介质及电子设备,主要目的在于能够解决情感分析模型训练过程中类别不平衡的问题,从而能够提高模型的情感分类精度。
2、依据本申请的第一方面,提供了一种情感分析模型训练方法,该方法包括:
3、确定原始文本集合中属于少数情感类别的目标样本,以及所述
...【技术保护点】
1.一种情感分析模型训练方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述确定所述上下文文本与所述目标样本之间的语义相关度,包括:
3.根据权利要求1所述的方法,其特征在于,在所述确定原始文本集合中属于少数情感类别的目标样本,以及所述目标样本在所述原始文本集合中的数量比例之前,所述方法还包括:
4.根据权利要求1所述的方法,其特征在于,所述初始情感分析模型包括分类层和双向编码器预训练模型中的输入层和编码层,将所述训练样本输入至所述初始情感分析模型中进行基于方面的情感分析,得到所述训练样本的预测情感类别,包括:<
...【技术特征摘要】
1.一种情感分析模型训练方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述确定所述上下文文本与所述目标样本之间的语义相关度,包括:
3.根据权利要求1所述的方法,其特征在于,在所述确定原始文本集合中属于少数情感类别的目标样本,以及所述目标样本在所述原始文本集合中的数量比例之前,所述方法还包括:
4.根据权利要求1所述的方法,其特征在于,所述初始情感分析模型包括分类层和双向编码器预训练模型中的输入层和编码层,将所述训练样本输入至所述初始情感分析模型中进行基于方面的情感分析,得到所述训练样本的预测情感类别,包括:
5.根据权利要求4所述的方法,其特征在于,所述将所述标记后的训练样本输入至所述输入层进行处理,得到所述标记后的训练样本对应的嵌入向...
【专利技术属性】
技术研发人员:夏演,潘壮壮,罗金光,夏瑜,蒋玉峰,朱峰,
申请(专利权)人:常熟理工学院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。