【技术实现步骤摘要】
模型训练方法、图像分类方法、装置、设备及存储介质
[0001]本申请涉及但不限于人工智能
,尤其涉及一种模型训练方法、图像分类方法、装置、设备及存储介质。
技术介绍
[0002]深度学习广泛应用于工业视觉,其在复杂场景的表现明显优于传统图像处理算法。但是随着训练数据的不断增加,模型在不同数据集上迁移不可避免地会存在遗忘性问题,即在新数据集上训练深度学习分类模型,训练得到的新深度学习分类模型虽能够精确识别新数据特征,遗忘了在旧数据上学习到的知识的问题。
[0003]目前为解决模型遗忘性问题,主要采用蒸馏方法和模型组合方法。蒸馏往往会牺牲模型的准确率,其最主要的原因是:当旧模型的输出和新模型的输出偏差非常大的时候,通过蒸馏方法强行让他们一致,往往会得到负面的结果。模型组合的方式则会增加推理成本,推理时间变长。
技术实现思路
[0004]有鉴于此,本申请实施例至少提供一种模型训练方法、图像分类方法、装置、设备及存储介质。
[0005]本申请实施例的技术方案是这样实现的:第一方面,本申请实施例提供一种模型训练方法,所述方法包括:获取样本数据集;其中,所述样本数据集包括原始数据集中的至少一个原始样本;基于所述样本数据集,基于目标损失函数对第二分类模型的网络参数进行迭代更新,得到图像分类模型;其中,所述目标损失函数包括差异抑制损失;所述差异抑制损失用于表征针对所述样本数据集中同一样本,所述第二分类模型与第一分类模型分别对应的类别得分之间的差异;所述第一分类模型是利用所述原始数据集训练得到的。 ...
【技术保护点】
【技术特征摘要】
1.一种模型训练方法,其特征在于,所述方法包括:获取样本数据集;其中,所述样本数据集包括原始数据集中的至少一个原始样本;基于所述样本数据集,基于目标损失函数对第二分类模型的网络参数进行迭代更新,得到图像分类模型;其中,所述目标损失函数至少包括差异抑制损失;所述差异抑制损失用于表征针对所述样本数据集中同一样本,所述第二分类模型与第一分类模型分别对应的类别得分之间的差异;所述第一分类模型是利用所述原始数据集训练得到的。2.根据权利要求1所述的方法,其特征在于,所述第二分类模型至少包括全连接层,所述基于所述样本数据集,基于目标损失函数对第二分类模型的网络参数进行迭代更新,得到图像分类模型,包括:将所述样本数据集中的目标样本输入所述第二分类模型,得到所述全连接层输出的第二类别得分;基于所述第二类别得分,利用所述目标损失函数确定所述第二分类模型的学习损失值;基于所述学习损失值对所述第二分类模型的网络参数进行反向传播更新;响应于满足收敛条件,确定所述第二分类模型为所述图像分类模型。3.根据权利要求2所述的方法,其特征在于,所述基于所述第二类别得分,基于所述目标损失函数确定所述第二分类模型的学习损失值,包括:确定所述第一分类模型针对所述目标样本输出的第一类别得分;基于所述目标样本对应的所述第二类别得分和所述第一类别得分,确定所述差异抑制损失;基于所述差异抑制损失,确定所述学习损失值。4.根据权利要求2所述的方法,其特征在于,所述目标损失函数还包括拟合损失,所述拟合损失用于表征所述第二分类模型的预测类别与样本标签之间的差异;所述第二分类模型还包括所述全连接层之后的归一化层;所述基于所述样本数据集,基于目标损失函数对第二分类模型的网络参数进行迭代更新,得到图像分类模型,还包括:将所述样本数据集中的目标样本输入所述第二分类模型,得到所述归一化层输出的第二预测类别;其中,所述第二预测类别是所述归一化层对所述第二类别得分处理得到的;基于所述第二类别得分和所述第二预测类别,利用所述目标损失函数确定所述第二分类模型的学习损失值。5.根据权利要求4所述的方法,其特征在于,所述基于所述第二类别得分和所述第二预测类别,基于所述目标损失函数确定所述第二分类模型的学习损失值,包括:确定所述第一分类模型针对所述目标样本输出的第一类别得分;基于所述目标样本对应的所述第二类别得分和所述第一类别得分,确定所述差异抑制损失;基于所述第二预测类别和所述样本数据集的样本标签,确定所述拟合损失;对所述拟合损失和所述差异抑制损失进行加权求和,得到所述学习损失值。6.根据权利要求5所述的方法,其特征在于,所述基于所述目标样本对应的所述第二类
别得分和所述第一类别得分,确定所述差异抑制损失,包括:针对所述目标样本,确定所述第二类别得分和所述第一类别得分之间的变化距离;基于所...
【专利技术属性】
技术研发人员:请求不公布姓名,
申请(专利权)人:摩尔线程智能科技北京有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。