一种图像分类网络模型的训练方法、装置、设备和介质制造方法及图纸

技术编号：31236362 阅读：18 留言：0更新日期：2021-12-08 10:19

本发明专利技术实施例公开了一种图像分类网络模型的训练方法、装置、设备和介质，图像分类网络模型包括：特征提取子模型和至少一个类别对应的分类子模型，该训练方法包括：通过样本图像对比方式，基于无标签样本图像对特征提取子模型进行训练，无标签样本图像包括由正样本图像和负样本图像组成的第一样本图像对；将有标签样本图像输入训练结束后的目标特征提取子模型，得到目标特征图，并将目标特征图和有标签样本图像对应的标签类别，输入分类子模型，得到有标签样本图像的预测类别；在标签类别与预测类别确定的损失函数满足预设收敛条件的情况下，分类子模型训练结束，完成图像分类网络模型的训练，从而可以降低标注成本，并且保证模型的高性能。模型的高性能。模型的高性能。

全部详细技术资料下载

【技术实现步骤摘要】
一种图像分类网络模型的训练方法、装置、设备和介质

[0001]本专利技术实施例涉及计算机技术，尤其涉及一种图像分类网络模型的训练方法、装置、设备和介质。

技术介绍

[0002]随着深度学习技术的快速发展，可以利用基于深度学习的图像分类网络模型对图像中的物体进行识别分类。
[0003]目前，在使用图像分类网络模型之前，通常利用有监督方式对图像分类网络模型进行训练，以使训练后的图像分类网络模型可以准确地进行图像处理操作。
[0004]然而，在实现本专利技术过程中，专利技术人发现现有技术中至少存在如下问题：
[0005]在对图像分类网络模型进行有监督的训练过程中，模型的性能受限于样本数据采集的数量和标注的质量。为了获得一个高性能的图像分类网络模型，往往需要使用大量的标注数据训练模型，使得数据采集和标注的人工成本非常高，并且周期长不利于模型的迭代。

技术实现思路

[0006]本专利技术实施例提供了一种图像分类网络模型的训练方法、装置、设备和介质，以降低标注成本，并且保证图像分类网络模型的高性能。
[0007]第一方面，本专利技术实施例提供了一种图像分类网络模型的训练方法，所述图像分类网络模型包括：特征提取子模型和至少一个类别对应的分类子模型，该训练方法包括：
[0008]通过样本图像对比方式，基于无标签样本图像对所述特征提取子模型进行训练，所述无标签样本图像包括由正样本图像和负样本图像组成的第一样本图像对；
[0009]在所述第一样本图像对中的所述正样本图像和所...

【技术保护点】

【技术特征摘要】
1.一种图像分类网络模型的训练方法，其特征在于，所述图像分类网络模型包括：特征提取子模型和至少一个类别对应的分类子模型，该训练方法包括：通过样本图像对比方式，基于无标签样本图像对所述特征提取子模型进行训练，所述无标签样本图像包括由正样本图像和负样本图像组成的第一样本图像对；在所述第一样本图像对中的所述正样本图像和所述负样本图像之间的图像相似度满足预设收敛条件的情况下，所述特征提取子模型训练结束，得到目标特征提取子模型；将有标签样本图像输入所述目标特征提取子模型，得到目标特征图，并将所述目标特征图和所述有标签样本图像对应的标签类别，输入所述分类子模型，得到所述有标签样本图像的预测类别；在所述样本标签与所述预测标签确定的损失函数满足的情况下，所述分类子模型训练结束，完成所述图像分类模型的训练。2.根据权利要求1所述的方法，其特征在于，所述无标签样本图像还包括：由所述正样本图像和所述正样本图像对应的增强样本图像组成的第二样本图像对。3.根据权利要求2所述的方法，其特征在于，所述基于无标签样本图像对所述特征提取子模型进行训练，在所述第一样本图像对中的所述正样本图像和所述负样本图像之间的图像相似度满足预设收敛条件的情况下，所述特征提取子模型训练结束，得到目标特征提取子模型，包括：将所述正样本图像、所述正样本图像对应的增强样本图像和负样本图像分别输入至所述特征提取子模型中，并根据所述特征提取子模型的输出，确定所述正样本图像对应的正特征图、所述增强样本图像对应的增强特征图以及所述负样本图像对应的负特征图；根据所述正特征图和所述负特征图，确定所述第一样本图像对中的所述正样本图像和所述负样本图像之间的图像相似度；根据所述正特征图和所述增强特征图，确定所述第二样本图像对中的所述正样本图像和所述增强样本图像之间的图像相似度；根据所述正样本图像与所述负样本图像之间的图像相似度以及所述正样本图像和所述增强样本图像之间的图像相似度，确定训练总误差，并将所述训练总误差反向传播至所述特征提取子模型，调整所述特征提取子模型中的权值，直至达到预设收敛条件时训练结束，得到目标特征提取子模型。4.根据权利要求3所述的方法，其特征在于，所述根据所述正特征图和所述负特征图，确定所述第一样本图像对中的所述正样本图像和所述负样本图像之间的图像相似度，包括：对所述正特征图和所述负特征图进行拉平操作，确定所述正特征图对应的正特征向量和所述负特征图对应的负特征向量；根据所述正特征向量和所述负特征向量确定所述第一样本图像对中的所述正样本图像和所述负样本图像之间的图像相似度。5.根据权利要求3所述的方法，其特征在于，所述根据所述正样本图像与所述负样本图像之间的图像相似度以及所述正样本图像和所述增强样本图像之间的图像相似度，确定训练总误差，包括：基于三元损失函数，根据所述正样本图像与所述负样本图像之间的图像相似度以及所
述正样本图像和所述增强样本图像之间的图像相似度，确定训练总误差。6.根据权利要求2所述的方法，其特征在于，所述正样本图像是与自动驾驶场景相关的物体图像；所述正样本图像对应的增强样本图像是通过对所述正样本进行随机变换获得的样本图像；所述负样本图像是与自动驾驶场景完全不相关的物体图像。7.根据权利要求1所述的方法，其特征在于，所述分类子模型包括：编码网络模块和每个类别对应的一个独立的分支网络模块；其中，每个所述分支...

【专利技术属性】
技术研发人员：刘浩，
申请(专利权)人：京东鲲鹏江苏科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人