模型训练方法、装置、电子设备以及存储介质制造方法及图纸

技术编号：41192924 阅读：4 留言：0更新日期：2024-05-07 22:22

本申请实施例公开了一种模型训练方法、装置、电子设备以及存储介质。所述方法包括：获取支持集合，所述支持集合中存储有不同类别的图像切片；将待训练图像与所述图像切片进行拼接，得到增强样本图像；基于所述增强样本图像对多标签识别模型进行训练，以提升所述多标签识别模型的多标签识别能力。通过该方法实现了可以将由多个标签构成的图像解耦成不同标签类别的图像切片，继而将待训练图像与不同类别的图像切片进行组合，增大了多标签图像正样本/前景信息的丰富度，增加了不同标签组合的多样性，从而能够实现对图像物体目标信息与标签共现关系进行有效的正则化增强，进而有效提升多标签识别模型的多标签图像识别能力。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及深度学习，更具体地，涉及一种模型训练方法、装置、电子设备以及存储介质。

技术介绍

1、单标签图像识别假设每张图片只有一个需要识别的目标物体，且该目标物体占据图像的大部分区域。多标签图像识别则没有该假设，需要识别出分布在图像中各个区域的多个目标物体。因此单标签图像识别的数据增强方法难以直接应用到多标签图像识别任务中。

2、目标检测，语义分割等细粒度图像识别任务需要识别出图像中存在的多个目标物体及其位置。这些细粒度任务一般通过复制粘贴目标物体的图像切片对训练数据进行增强。相比目标检测，语义分割等细粒度图像识别任务，多标签识别仅有粗粒度的目标物体标签信息，而没有每个目标物体的位置信息。因此这些细粒度识别任务的增强方法难以直接应用到多标签图像识别任务中。

3、综上所述，多标签识别的特性导致其他领域的数据增强方法难以应用到多标签识别中，从而影响了多标签图像识别模型的性能。

技术实现思路

1、鉴于上述问题，本申请提出了一种模型训练方法、装置、电子设备以及存储介质，以改善上述问题。

2、第一方面，本申请实施例提供了一种模型训练方法，应用于电子设备，所述方法包括：获取支持集合，所述支持集合中存储有不同类别的图像切片；将待训练图像与所述图像切片进行拼接，得到增强样本图像；基于所述增强样本图像对多标签识别模型进行训练，以提升所述多标签识别模型的多标签识别能力。

3、第二方面，本申请实施例提供了一种模型训练装置，运行于电子设备，所述装置包括：图像

4、第三方面，本申请提供了一种电子设备，包括一个或多个处理器以及存储器；一个或多个程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行，所述一个或多个程序配置用于执行上述第一方面的方法。

5、第四方面，本申请提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有程序代码，其中，在所述程序代码运行时执行上述第一方面的方法。

6、本申请提供的一种模型训练方法、装置、电子设备以及存储介质，通过获取支持集合，所述支持集合中存储有不同类别的图像切片；将待训练图像与所述图像切片进行拼接，得到增强样本图像；基于所述增强样本图像对多标签识别模型进行训练，以提升所述多标签识别模型的多标签识别能力。从而通过上述方式实现了可以将由多个标签构成的图像解耦成不同标签类别的图像切片，继而将待训练图像与不同类别的图像切片进行组合，增大了多标签图像正样本/前景信息的丰富度，增加了不同标签组合的多样性，从而能够实现对图像物体目标信息与标签共现关系进行有效的正则化增强，进而有效提升多标签识别模型的多标签图像识别能力。

本文档来自技高网...

【技术保护点】

1.一种模型训练方法，其特征在于，应用于电子设备，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述获取支持集合，包括：

3.根据权利要求2所述的方法，其特征在于，所述根据所述注意力图定位对应图像类别在图像中出现的区域，包括：

4.根据权利要求2所述的方法，其特征在于，所述根据所述注意力图定位对应图像类别在图像中出现的区域，包括：

5.根据权利要求2所述的方法，其特征在于，所述方法还包括：

6.根据权利要求1所述的方法，其特征在于，所述将待训练图像与所述图像切片进行拼接，得到增强样本图像，包括：

7.根据权利要求6所述的方法，其特征在于，所述将待训练图像分别与不同数量的所述图像切片进行马赛克混合，得到多个增强样本图像之前，还包括：

8.一种模型训练装置，其特征在于，运行于电子设备，所述装置包括：

9.一种电子设备，其特征在于，包括一个或多个处理器以及存储器；

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有程序代码，其中，在所述程序代码被

...

【技术特征摘要】

1.一种模型训练方法，其特征在于，应用于电子设备，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述获取支持集合，包括：

3.根据权利要求2所述的方法，其特征在于，所述根据所述注意力图定位对应图像类别在图像中出现的区域，包括：

4.根据权利要求2所述的方法，其特征在于，所述根据所述注意力图定位对应图像类别在图像中出现的区域，包括：

5.根据权利要求2所述的方法，其特征在于，所述方法还包括：

6.根据权利要求1所述的方法，其特征在于，所述将待训练...

【专利技术属性】
技术研发人员：张有才，李亚乾，郭彦东，
申请(专利权)人：上海瑾盛通信科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人