样本图像数据的增强、模型训练、分类方法、装置与设备制造方法及图纸

技术编号：40064363 阅读：5 留言：0更新日期：2024-01-16 23:11

本申请公开一种样本图像数据的增强方法、图像分类模型的训练方法、图像分类方法、装置、设备和存储介质，以解决如何加强无标签样本图像数据在模型训练过程中的作用，以避免出现模型对于类别预测的不平衡现象的问题。增强方法包括：从样本图像数据集中，选取满足预设分类困难条件的困难样本图像数据；采用与待训练的第一图像分类模型的分类任务相匹配的数据增强方式，对困难样本图像数据进行数据增强，得到增广样本图像数据集；其中，增广样本图像数据集用于待训练的第一图像分类模型的模型训练。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及人工智能领域，尤其涉及一种样本图像数据的增强方法、图像分类模型的训练方法、图像分类方法、装置、设备和存储介质。

技术介绍

1、在半监督目标检测任务中，由于有标签样本图像数据在数据集中的数量往往相对较少，从而采用这样的数据集对于深度学习模型的训练，会面临“监督有限”的问题，容易导致训练得到的深度学习模型在进行类别预测时出现不平衡现象——即，模型更容易识别出常见类别或易于检测的目标，而漏检稀有类别或难以检测的目标。

2、针对上述问题，如何加强无标签样本图像数据在训练过程中的作用，以避免上述不平衡现象的出现，是亟待解决的问题。

技术实现思路

1、本申请实施例提供一种样本图像数据的增强方法，用以解决如何加强无标签样本图像数据在模型训练过程中的作用，以避免出现模型对于类别预测的不平衡现象的问题。

2、本申请实施例还提供一种图像分类模型的训练方法，用以解决如何加强无标签样本图像数据在训练过程中的作用，以避免出现类别预测的不平衡现象的问题。

3、本申请实施例还提供一种图像分类方法，以及与所述样本图像数据的增强方法、所述图像分类模型的训练方法和所述图像分类方法分别对应的装置、设备和计算机可读存储介质。

4、本申请实施例采用下述技术方案：

5、一种样本图像数据的增强方法，包括：

6、从样本图像数据集中，选取满足预设分类困难条件的困难样本图像数据；所述困难样本图像数据为所述样本图像数据集中的无标签样本图像输入待训练的第一

7、采用与所述待训练的第一图像分类模型的分类任务相匹配的数据增强方式，对所述困难样本图像数据进行数据增强，得到增广样本图像数据集；

8、其中，所述增广样本图像数据集用于所述待训练的第一图像分类模型的模型训练。

9、一种图像分类模型的训练方法，包括：

10、获取样本图像数据集；所述样本图像数据集包含有标签样本图像数据、无标签样本图像数据，以及基于所述无标签样本图像数据得到的第一增广样本图像数据；

11、将所述样本图像数据集输入待训练的第一图像分类模型；进行迭代训练，根据所述待训练的第一图像分类模型对于所述样本图像数据集的有监督损失和无监督损失，调整所述待训练的第一图像分类模型的参数；直至满足所述第一图像分类模型的迭代条件，得到训练后的第一图像分类模型；

12、其中，所述第一增广样本图像数据，采用如上所述的一种样本图像数据的增强方法得到。

13、一种图像分类方法，包括：

14、获取待分类的目标图像数据；

15、将所述目标图像数据输入训练好的第一图像分类模型，得到所述目标图像数据的图像分类结果；

16、其中，所述第一图像分类模型，采用如上所述的图像分类模型的训练方法训练得到。

17、一种样本图像数据的增强装置，包括：

18、困难样本选取单元，从样本图像数据集中，选取满足预设分类困难条件的困难样本图像数据；所述困难样本图像数据为所述样本图像数据集中的无标签样本图像数据输入待训练的第一图像分类模型，得到的无监督损失满足预设分类困难条件对应的无标签样本图像数据；

19、增强单元，用于采用与所述待训练的第一图像分类模型的分类任务相匹配的数据增强方式，对所述困难样本图像数据进行数据增强，得到增广样本图像数据集；

20、其中，所述增广样本图像数据集用于所述待训练的第一图像分类模型的模型训练。

21、一种图像分类装置，包括：

22、获取单元，获取待分类的目标图像数据；

23、分类单元，用于将所述目标图像数据输入训练好的第一图像分类模型，以获得所述第一图像分类模型对于所述目标图像数据的分类结果；

24、其中，所述第一图像分类模型，采用如上所述的图像分类模型的训练方法训练得到。

25、一种计算设备，包括：存储器及处理器，其中，

26、所述存储器，用于存储计算机程序；

27、所述处理器，与所述存储器耦合，用于执行所述存储器中存储的所述计算机程序，以用于执行上述的方法。

28、一种存储有计算机程序的计算机可读存储介质，所述计算机程序被计算机执行时能够实现上述的方法。

29、本申请实施例采用的上述至少一个技术方案能够达到以下有益效果：

30、通过从样本图像数据集中，选取无监督损失满足预设分类困难条件对应的无标签样本图像数据进行数据增强，并将数据增强的困难样本图像数据用于待训练的第一图像分类模型的模型训练，从而可以使基于困难样本图像数据对于待训练的第一图像分类模型(比如深度学习模型)的训练更为充分，进而使得最终训练得到的模型对于诸如稀有类别和难以检测的目标这样的“分类困难”的目标，能够具有较高的分类准确性。

31、同时，本申请实施例提供的方案，是将需要进行数据增强的样本图像数据聚焦在困难样本图像数据上，而非对样本图像数据集中所有的无标签样本图像数据进行一视同仁的数据增强。对困难样本图像数据进行数据增强，进而基于增广样本图像数据对第一图像分类模型进行训练，更能显著改善第一图像分类模型对于“分类困难”的目标的识别准确性，从而，本申请实施例提供的方案是一种在不耗费较多处理资源的前提下，能够较大程度改善样本图像数据集、发挥无标签样本图像数据在训练过程中的作用的优选方案。

本文档来自技高网...

【技术保护点】

1.一种样本图像数据的增强方法，其特征在于，包括：

2.如权利要求1所述的方法，其特征在于，满足预设分类困难条件的无监督损失，包括：

3.如权利要求1所述的方法，其特征在于，所述待训练的第一图像分类模型的分类任务包括目标检测任务；

4.如权利要求3所述的方法，其特征在于，对所述困难样本图像数据中的目标对象进行尺度变换，得到所述增广样本图像数据集，包括：

5.如权利要求4所述的方法，其特征在于，所述对所述困难样本图像数据中的目标对象进行增大处理，得到所述增广样本图像数据集，包括：

6.如权利要求1-5任一项所述的方法，其特征在于，所述无标签样本图像数据包括：具备目标伪标签的无标签样本图像数据；

7.一种图像分类模型的训练方法，其特征在于，包括：

8.一种图像分类方法，其特征在于，包括：

9.一种样本图像数据的增强装置，其特征在于，包括：

10.一种图像分类装置，其特征在于，包括：

11.一种计算设备，其特征在于，包括：存储器及处理器，其中，

12.一种

...

【技术特征摘要】

1.一种样本图像数据的增强方法，其特征在于，包括：

2.如权利要求1所述的方法，其特征在于，满足预设分类困难条件的无监督损失，包括：

3.如权利要求1所述的方法，其特征在于，所述待训练的第一图像分类模型的分类任务包括目标检测任务；

4.如权利要求3所述的方法，其特征在于，对所述困难样本图像数据中的目标对象进行尺度变换，得到所述增广样本图像数据集，包括：

5.如权利要求4所述的方法，其特征在于，所述对所述困难样本图像数据中的目标对象进行增大处理，得到所述增广样本图像数据集，包括：

6.如权...

【专利技术属性】
技术研发人员：吕永春，朱徽，王洪斌，周迅溢，曾定衡，蒋宁，吴海英，
申请(专利权)人：马上消费金融股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人