机器学习模型训练方法和装置、情感分类方法和装置制造方法及图纸

技术编号:40544250 阅读:15 留言:0更新日期:2024-03-05 19:01
本公开提供一种机器学习模型训练方法和装置、情感分类方法和装置,涉及人工智能领域。机器学习模型训练方法包括:获取多个图文样本特征向量;利用机器学习模型对多个图文样本特征向量进行处理,以得到多个情感质心;根据每个图文样本特征向量的预设标签,确定每个图文样本特征向量对应的情感质心;根据每个图文样本特征向量与对应情感质心间的距离确定第一损失函数,并根据机器学习模型的交叉熵信息确定第二损失函数;根据第一损失函数和第二损失函数确定目标损失函数;利用目标损失函数对机器学习模型进行训练。

【技术实现步骤摘要】

本公开涉及人工智能领域,特别涉及一种机器学习模型训练方法和装置、情感分类方法和装置


技术介绍

1、图文情感识别是指:针对给定图片和文本的信息,自动识别出其中反映的用户情感。图文情感识别在电商等智能客服中有极高的应用价值,这是由于在客服机器人的会话过程中,用户不仅会发来纯文本信息,还可能包含图片信息,精确的识别出用户信息中流出的情感,是一个有“温度”的客服机器人必不可少的一环。

2、目前,主要利用特征融合-分类的方式来解决图文情感分类问题。然而,融合后的语义特征可能与其原本语义分布并不一致,从而导致分类效果差。为此,通常采用对比学习的方式来解决这种特征偏移问题。


技术实现思路

1、专利技术人注意到,在相关技术中,通常采用对比学习的方式来解决这种特征偏移问题。但对比学习仍存在以下两个问题:一是由于缺乏全局监督,只在一个批次(batch)中对比样本有限,不能很好解决这个问题;二是对比学习在训练过程中需要构造对比矩阵,这极大增加了计算量。

2、据此,本公开提供一种情感分类方法,通过利用已知样本文档来自技高网...

【技术保护点】

1.一种机器学习模型训练方法,包括:

2.根据权利要求1所述的方法,其中,根据所述每个图文样本特征向量与对应情感质心间的距离确定第一损失函数包括:

3.根据权利要求2所述的方法,其中,

4.根据权利要求3所述的方法,其中,

5.根据权利要求2所述的方法,其中,根据所述第i个图文样本特征向量与对应情感质心间的距离和所述距离基数得到第i个损失信息包括:

6.根据权利要求5所述的方法,其中,

7.根据权利要求2所述的方法,其中,根据所述N个距离确定距离基数包括:

8.根据权利要求2所述的方法,其中,计算第i个图...

【技术特征摘要】

1.一种机器学习模型训练方法,包括:

2.根据权利要求1所述的方法,其中,根据所述每个图文样本特征向量与对应情感质心间的距离确定第一损失函数包括:

3.根据权利要求2所述的方法,其中,

4.根据权利要求3所述的方法,其中,

5.根据权利要求2所述的方法,其中,根据所述第i个图文样本特征向量与对应情感质心间的距离和所述距离基数得到第i个损失信息包括:

6.根据权利要求5所述的方法,其中,

7.根据权利要求2所述的方法,其中,根据所述n个距离确定距离基数包括:

8.根据权利要求2所述的方法,其中,计算第i个图文样本特征向量与对应情感质心间的距离包括:

9.根据权利要求8所述的方法,其中,

10.根据权利要求1所述的方法,还包括:

11.根据权利要求10所述的方法,其中,所...

【专利技术属性】
技术研发人员:袁韶祖陈蒙何晓冬祝天刚
申请(专利权)人:京东城市北京数字科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1