一种图像分类网络模型的训练方法、装置、设备和介质制造方法及图纸

技术编号:31236362 阅读:18 留言:0更新日期:2021-12-08 10:19
本发明专利技术实施例公开了一种图像分类网络模型的训练方法、装置、设备和介质,图像分类网络模型包括:特征提取子模型和至少一个类别对应的分类子模型,该训练方法包括:通过样本图像对比方式,基于无标签样本图像对特征提取子模型进行训练,无标签样本图像包括由正样本图像和负样本图像组成的第一样本图像对;将有标签样本图像输入训练结束后的目标特征提取子模型,得到目标特征图,并将目标特征图和有标签样本图像对应的标签类别,输入分类子模型,得到有标签样本图像的预测类别;在标签类别与预测类别确定的损失函数满足预设收敛条件的情况下,分类子模型训练结束,完成图像分类网络模型的训练,从而可以降低标注成本,并且保证模型的高性能。模型的高性能。模型的高性能。

【技术实现步骤摘要】
一种图像分类网络模型的训练方法、装置、设备和介质


[0001]本专利技术实施例涉及计算机技术,尤其涉及一种图像分类网络模型的训练方法、装置、设备和介质。

技术介绍

[0002]随着深度学习技术的快速发展,可以利用基于深度学习的图像分类网络模型对图像中的物体进行识别分类。
[0003]目前,在使用图像分类网络模型之前,通常利用有监督方式对图像分类网络模型进行训练,以使训练后的图像分类网络模型可以准确地进行图像处理操作。
[0004]然而,在实现本专利技术过程中,专利技术人发现现有技术中至少存在如下问题:
[0005]在对图像分类网络模型进行有监督的训练过程中,模型的性能受限于样本数据采集的数量和标注的质量。为了获得一个高性能的图像分类网络模型,往往需要使用大量的标注数据训练模型,使得数据采集和标注的人工成本非常高,并且周期长不利于模型的迭代。

技术实现思路

[0006]本专利技术实施例提供了一种图像分类网络模型的训练方法、装置、设备和介质,以降低标注成本,并且保证图像分类网络模型的高性能。
[0007]第一方面,本专利技术实施例提供了一种图像分类网络模型的训练方法,所述图像分类网络模型包括:特征提取子模型和至少一个类别对应的分类子模型,该训练方法包括:
[0008]通过样本图像对比方式,基于无标签样本图像对所述特征提取子模型进行训练,所述无标签样本图像包括由正样本图像和负样本图像组成的第一样本图像对;
[0009]在所述第一样本图像对中的所述正样本图像和所述负样本图像之间的图像相似度满足预设收敛条件的情况下,所述特征提取子模型训练结束,得到目标特征提取子模型;
[0010]将有标签样本图像输入所述目标特征提取子模型,得到目标特征图,并将所述目标特征图和所述有标签样本图像对应的标签类别,输入所述分类子模型,得到所述有标签样本图像的预测类别;
[0011]在所述标签类别与所述预测类别确定的损失函数满足预设收敛条件的情况下,所述分类子模型训练结束,完成所述图像分类网络模型的训练。
[0012]第二方面,本专利技术实施例还提供了一种图像分类网络模型的训练装置,所述图像分类网络模型包括:特征提取子模型和至少一个类别对应的分类子模型,该训练装置包括:
[0013]特征提取子模型训练模块,用于通过样本图像对比方式,基于无标签样本图像对所述特征提取子模型进行训练,所述无标签样本图像包括由正样本图像和负样本图像组成的第一样本图像对;在所述第一样本图像对中的所述正样本图像和所述负样本图像之间的图像相似度满足预设收敛条件的情况下,所述特征提取子模型训练结束,得到目标特征提取子模型;
[0014]分类子模型训练模块,用于将有标签样本图像输入所述目标特征提取子模型,得到目标特征图,并将所述目标特征图和所述有标签样本图像对应的标签类别,输入所述分类子模型,得到所述有标签样本图像的预测类别;在所述标签类别与所述预测类别确定的损失函数满足预设收敛条件的情况下,所述分类子模型训练结束,完成所述图像分类网络模型的训练。
[0015]第三方面,本专利技术实施例还提供了一种电子设备,所述电子设备包括:
[0016]一个或多个处理器;
[0017]存储器,用于存储一个或多个程序;
[0018]当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本专利技术任意实施例所提供的图像分类网络模型的训练方法。
[0019]第四方面,本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本专利技术任意实施例所提供的图像分类网络模型的训练方法。
[0020]上述专利技术中的实施例具有如下优点或有益效果:
[0021]通过样本图像对比方式,基于无标签样本图像,即由正样本图像和负样本图像组成的第一样本图像对对图像分类网络模型中的特征提取子模型进行训练,在第一样本图像对中的正样本图像和负样本图像之间的图像相似度满足预设收敛条件的情况下,特征提取子模型训练结束,得到目标特征提取子模型,从而可以利用自监督方式训练特征提取子模型完成大量无标签样本数据的学习,使得特征提取子模型可以准确地提取特征信息,并在特征提取子模型训练结束,获得目标特征提取子模型后,将有标签样本图像输入目标特征提取子模型,得到目标特征图,并将目标特征图和有标签样本图像对应的标签类别,输入分类子模型,得到有标签样本图像的预测类别,在标签类别与预测类别确定的损失函数满足预设收敛条件的情况下,分类子模型训练结束,完成图像分类网络模型的训练,从而可以基于少量的有标签样本图像对图像分类网络模型中的分类子模型进行训练,使得分类子模型可以基于训练后的目标特征提取子模型提取的特征信息准确地进行分类,从而保证了图像分类网络模型的高性能,并且只需对少量的样本数据进行标注,大大降低了标注成本。
附图说明
[0022]图1是本专利技术实施例一提供的一种图像分类网络模型的训练方法的流程图;
[0023]图2是本专利技术实施例一所涉及的一种图像分类网络模型的示例;
[0024]图3是本专利技术实施例一所涉及的一种特征提取子模型训练过程的示例;
[0025]图4是本专利技术实施例二提供的一种图像分类网络模型的训练方法的流程图;
[0026]图5是本专利技术实施例二所涉及的一种图像分类网络模型的示例;
[0027]图6是本专利技术实施例三提供的一种图像分类网络模型的训练装置的结构示意图;
[0028]图7是本专利技术实施例四提供的一种电子设备的结构示意图。
具体实施方式
[0029]下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便
于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。
[0030]实施例一
[0031]图1为本专利技术实施例一提供的一种图像分类网络模型的训练方法的流程图,本实施例可适用于对图像分类网络模型进行训练的情况,尤其是可以用于在自动驾驶场景中,对用于识别场景中的物体的图像分类网络模型进行训练的情况。该方法可以由图像分类网络模型的训练装置来执行,该装置可以由软件和/或硬件的方式来实现,集成于电子设备中。
[0032]图2给出了一种图像分类网络模型的示例。如图2,本实施例中的图像分类网络模型可以包括:特征提取子模型和至少一个类别对应的分类子模型。其中,特征提取子模型可以用于:对输入图像进行特征提取,获取输入图像对应的特征图,并将特征图输入至分类子模型中。分类子模型可以用于:基于输入的特征图进行分类,预测出输入图像中的物体所属于的类别,并将该类别进行输出。通过利用图像分类网络模型可以识别出图像中的物体所属于的类别。
[0033]如图1所示,图像分类网络模型的训练方法具体包括以下步骤:
[0034]S110、通过样本图像对比方式,基于无标签样本图像对特征提取子模型进行训练,无标签样本图像本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像分类网络模型的训练方法,其特征在于,所述图像分类网络模型包括:特征提取子模型和至少一个类别对应的分类子模型,该训练方法包括:通过样本图像对比方式,基于无标签样本图像对所述特征提取子模型进行训练,所述无标签样本图像包括由正样本图像和负样本图像组成的第一样本图像对;在所述第一样本图像对中的所述正样本图像和所述负样本图像之间的图像相似度满足预设收敛条件的情况下,所述特征提取子模型训练结束,得到目标特征提取子模型;将有标签样本图像输入所述目标特征提取子模型,得到目标特征图,并将所述目标特征图和所述有标签样本图像对应的标签类别,输入所述分类子模型,得到所述有标签样本图像的预测类别;在所述样本标签与所述预测标签确定的损失函数满足的情况下,所述分类子模型训练结束,完成所述图像分类模型的训练。2.根据权利要求1所述的方法,其特征在于,所述无标签样本图像还包括:由所述正样本图像和所述正样本图像对应的增强样本图像组成的第二样本图像对。3.根据权利要求2所述的方法,其特征在于,所述基于无标签样本图像对所述特征提取子模型进行训练,在所述第一样本图像对中的所述正样本图像和所述负样本图像之间的图像相似度满足预设收敛条件的情况下,所述特征提取子模型训练结束,得到目标特征提取子模型,包括:将所述正样本图像、所述正样本图像对应的增强样本图像和负样本图像分别输入至所述特征提取子模型中,并根据所述特征提取子模型的输出,确定所述正样本图像对应的正特征图、所述增强样本图像对应的增强特征图以及所述负样本图像对应的负特征图;根据所述正特征图和所述负特征图,确定所述第一样本图像对中的所述正样本图像和所述负样本图像之间的图像相似度;根据所述正特征图和所述增强特征图,确定所述第二样本图像对中的所述正样本图像和所述增强样本图像之间的图像相似度;根据所述正样本图像与所述负样本图像之间的图像相似度以及所述正样本图像和所述增强样本图像之间的图像相似度,确定训练总误差,并将所述训练总误差反向传播至所述特征提取子模型,调整所述特征提取子模型中的权值,直至达到预设收敛条件时训练结束,得到目标特征提取子模型。4.根据权利要求3所述的方法,其特征在于,所述根据所述正特征图和所述负特征图,确定所述第一样本图像对中的所述正样本图像和所述负样本图像之间的图像相似度,包括:对所述正特征图和所述负特征图进行拉平操作,确定所述正特征图对应的正特征向量和所述负特征图对应的负特征向量;根据所述正特征向量和所述负特征向量确定所述第一样本图像对中的所述正样本图像和所述负样本图像之间的图像相似度。5.根据权利要求3所述的方法,其特征在于,所述根据所述正样本图像与所述负样本图像之间的图像相似度以及所述正样本图像和所述增强样本图像之间的图像相似度,确定训练总误差,包括:基于三元损失函数,根据所述正样本图像与所述负样本图像之间的图像相似度以及所
述正样本图像和所述增强样本图像之间的图像相似度,确定训练总误差。6.根据权利要求2所述的方法,其特征在于,所述正样本图像是与自动驾驶场景相关的物体图像;所述正样本图像对应的增强样本图像是通过对所述正样本进行随机变换获得的样本图像;所述负样本图像是与自动驾驶场景完全不相关的物体图像。7.根据权利要求1所述的方法,其特征在于,所述分类子模型包括:编码网络模块和每个类别对应的一个独立的分支网络模块;其中,每个所述分支...

【专利技术属性】
技术研发人员:刘浩
申请(专利权)人:京东鲲鹏江苏科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1