模型训练方法、图像分类方法、装置及电子设备制造方法及图纸

技术编号：39734577 阅读：7 留言：0更新日期：2023-12-17 23:36

本申请实施例公开了一种模型训练方法、图像分类方法、装置及电子设备，通过从未分类的存量样本图像中筛选出目标图像集，可以复用原有的训练样本，无须重新获取大量的增量样本图像进行训练，提升模型训练过程中的样本获取效率，进而提升训练效率；在此基础上，通过根据第一存量特征确定第一图像集与第二图像集之间的第一特征距离，根据第一特征距离确定对比损失，能够通过第一特征距离来拉远第一图像集与第二图像集之间的特征距离，使得目标模型能够区分增量样本图像和不属于第二类别且与增量样本图像相似的存量样本图像，从而学习到新增图像的表征，提升目标模型的性能，可广泛应用于云技术、人工智能、智慧交通、导航等技术领域。域。域。

全部详细技术资料下载

【技术实现步骤摘要】
模型训练方法、图像分类方法、装置及电子设备

[0001]本申请涉及人工智能
，特别是涉及一种模型训练方法、图像分类方法、装置及电子设备。

技术介绍

[0002]随着人工智能的发展，图像特征被广泛应用于各种场景，例如图像分类等场景。在对模型进行训练的过程中，往往需要模型快速地对新增的图像具备表征能力，否则会使得模型无法正确地提取新增的图像的图像特征，影响下游任务的执行，例如在图像分类场景中会对新增的图像产生误判，因而需要对模型进行增量训练。相关技术中，往往需要花费较长的时间获取对模型进行增量训练时所需要的训练样本，导致模型的训练效率下降。

技术实现思路

[0003]以下是对本申请详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。
[0004]本申请实施例提供了一种模型训练方法、图像分类方法、装置及电子设备，能够在学习新增图像的表征的同时提升模型的训练效率。
[0005]一方面，本申请实施例提供了一种模型训练方法，包括：
[0006]获取存量图像集，其中，所述存量图像集包括属于第一类别的存量样本图像以及未分类的存量样本图像；
[0007]基于目标模型对未分类的存量样本图像进行特征提取，得到第一存量特征；
[0008]获取属于第二类别的增量样本图像，基于所述目标模型对所述增量样本图像进行特征提取，得到增量特征；
[0009]根据所述第一存量特征和所述增量特征，从未分类的存量样本图像中筛选出目标图像集，其中，所述目标图像集包括属于所述第二类别的...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法，其特征在于，包括：获取存量图像集，其中，所述存量图像集包括属于第一类别的存量样本图像以及未分类的存量样本图像；基于目标模型对所述未分类的存量样本图像进行特征提取，得到第一存量特征；获取属于第二类别的增量样本图像，基于所述目标模型对所述增量样本图像进行特征提取，得到增量特征；根据所述第一存量特征和所述增量特征，从所述未分类的存量样本图像中筛选出目标图像集，其中，所述目标图像集包括属于所述第二类别的第一图像集，以及不属于所述第二类别且与所述增量样本图像相似的第二图像集；根据所述第一存量特征确定所述第一图像集与所述第二图像集之间的第一特征距离，根据所述第一特征距离确定对比损失，根据所述对比损失训练所述目标模型。2.根据权利要求1所述的模型训练方法，其特征在于，所述根据所述第一存量特征确定所述第一图像集与所述第二图像集之间的第一特征距离，包括：根据所述第一存量特征确定所述第一图像集的第一聚类中心，以及所述第二图像集的第二聚类中心；根据所述第一聚类中心和所述第二聚类中心之间的距离，确定所述第一图像集与所述第二图像集之间的第一特征距离。3.根据权利要求2所述的模型训练方法，其特征在于，所述第一聚类中心通过第一中心向量表示，所述第二聚类中心通过第二中心向量表示，所述根据所述第一聚类中心和所述第二聚类中心之间的距离，确定所述第一图像集与所述第二图像集之间的第一特征距离，包括：确定所述第一中心向量的向量元素与所述第二中心向量对应位置的向量元素的均方误差；将所述均方误差作为所述第一图像集与所述第二图像集之间的第一特征距离。4.根据权利要求1所述的模型训练方法，其特征在于，所述根据所述第一特征距离确定对比损失，包括：基于所述目标模型对属于所述第一类别的存量样本图像进行特征提取，得到第二存量特征；将属于所述第一类别的存量样本图像作为第三图像集，根据所述第一存量特征和所述第二存量特征，确定所述第一图像集与所述第三图像集之间的第二特征距离；根据所述第一特征距离和所述第二特征距离确定对比损失。5.根据权利要求4所述的模型训练方法，其特征在于，所述第一类别的数量为多个，所述根据所述第一存量特征和所述第二存量特征，确定所述第一图像集与所述第三图像集之间的第二特征距离，包括：根据所述第一存量特征确定所述第一图像集的第一聚类中心，根据所述第二存量特征确定所述第三图像集的多个第三聚类中心；将所述第一聚类中心与各个所述第三聚类中心之间的距离之和，作为所述第一图像集与所述第三图像集之间的第二特征距离；或者，确定多个所述第三聚类中心的均值，得到平均聚类中心，将所述第一聚类中心与所述平均聚类中心之间的距离，作为所述第一图像集
与所述第三图像集之间的第二特征距离。6.根据权利要求1至5任意一项所述的模型训练方法，其特征在于，所述根据所述对比损失训练所述目标模型，包括：根据所述第一存量特征对所述第一图像集中的存量样本图像进行分类，得到样本分类结果，其中，所述样本分类结果包括所述第一图像集中的存量样本图像属于所述第一类别的概率、属于所述第二类别的概率以及属于未分类的概率；根据所述样本分类结果确定分类损失，根据所述分类损失和所述对比损失确定目标损失，根据所述目标损失训练所述目标模型。7.根据权利要求6所述的模型训练方法，其特征在于，所述根据所述第一存量特征对所述第一图像集中的存量样本图像进行分类，得到样本分类结果，包括：对所述第一存量特征进行映射，得到映射特征；获取原始激活函数，对所述原始激活函数进行往横坐标右侧方向的偏移操作，以及进行往纵坐标中心方向的缩放操作，得到目标激活函数；基于所述目标激活函数对所述映射特征进行激活处理，得到样本分类结果。8.根据权利要求7所述的模型训练方法，其特征在于，所述原始激活函数为S型函数，所述S型函数包括形态参数组合，所述对所述原始激活函数进行往横坐标右侧方向的偏移操作，以及进行往纵坐标中心方向的缩放操作，得到目标激活函数，包括：获取用于将所述S型函数往横坐标右侧方向偏移并往纵坐标中心方向缩放的两个预设数值组合；根据两个所述预设数值组合分别对形态参数组合进行赋值，得到第一激活函数和第二激活函数；计算所述第一激活函数与第二激活函数的均值，得到目标激活函数。9.根据权利要求1所述的模型训练方法，其特征在于，所述增量样本图像为增量图像集中的其中一个图像，所述根据所述第一存量特征和所述增量特征，从所述未分类的存量样本图像中筛选出目标图像集，包括...

【专利技术属性】
技术研发人员：朱城，高英国，鄢科，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人