标签生成、图像分类模型的训练、图像分类方法及装置制造方法及图纸

技术编号：40319768 阅读：8 留言：0更新日期：2024-02-09 14:16

本申请公开了一种标签生成、图像分类模型的方法、图像分类方法及装置。所述标签生成方法包括：分别通过教师模型和学生模型对无标签图像进行分类识别得到教师模型和学生模型各自对应的分类参考信息；每个模型对应的分类参考信息均包括无标签图像所包含的N个检测对象及每个检测对象属于多个类别中每个类别的概率；基于教师模型对应的分类参考信息确定每个类别在教师模型对应的检测对象数量，及基于学生模型对应的分类参考信息确定每个类别在学生模型对应的检测对象数量；基于每个类别在教师模型及学生模型对应的检测对象数量确定每个类别的概率阈值；基于教师模型对应的分类参考信息和每个类别的概率阈值，为学生模型生成无标签图像对应的伪标签。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及人工智能，尤其涉及一种标签生成、图像分类模型的训练、图像分类方法及装置。

技术介绍

1、近年来，基于卷积神经网络的深度学习技术在图像分类、目标检测、实例分割等领域取得了显著效果。然而，大规模神经网络依赖大规模有标签数据的驱动。在实际应用场景中，构建适用于有监督学习的大规模有标注数据集是困难的、耗时的且依赖专家经验。然而，获取无标注的图像数据是容易的，依靠自动计算机程序可以快速获取大量无标签图像。通过利用少量有标签图像和大量无标签图像，有效地进行深度学习任务，训练得到性能优异的深度学习模型，有效解决有标签图像的数量匮乏问题，被称为半监督学习。为节约人工标注开销，半监督学习被提出并得到广泛研究。

2、在目标检测任务中，类别间通常存在不平衡的情况，各类别学习的困难程度存在明显差异。这一问题在半监督学习目标检测任务中更加严重，确认偏差与错误累积的问题更加显著。也就是说，在半监督目标检测任务中，有标签图像提供的监督信息匮乏，模型倾向于识别出更多容易识别的检测对象，并因此导致生成的伪标签中包含更多的容易类别的检测对象和更少的困难类别的检测对象，进而加剧不平衡学习问题。这一现象不利于无标签图像的利用率(困难类别利用率低)，进而导致训练出的模型的训练效果不佳，进而影响模型的分类准确率。

技术实现思路

1、本申请实施例的目的是提供一种标签生成、图像分类模型的方法、图像分类方法及装置，用于解决现有的图像分类模型训练过程中存在的伪标签中困难类别的利用率低而导致模型训练效果不佳的问题。

2、为了实现上述目的，本申请实施例采用下述技术方案：

3、第一方面，本申请实施例提供一种标签生成方法，所述标签生成方法应用于半监督目标检测架构中，所述半监督目标检测架构包括教师模型和学生模型，所述标签生成方法包括：

4、通过所述教师模型对无标签图像进行分类识别，得到所述教师模型对应的分类参考信息，以及通过所述学生模型对所述无标签图像进行分类识别，得到所述学生模型对应的分类参考信息；所述教师模型对应的分类参考信息和所述学生模型对应的分类参考信息中均包括识别到的所述无标签图像所包含的n个检测对象以及所述n个检测对象中每个检测对象属于多个类别中每个类别的概率；n为正整数；

5、基于所述教师模型对应的分类参考信息，确定所述多个类别中每个类别在所述教师模型对应的检测对象数量，以及基于所述学生模型对应的分类参考信息，确定所述多个类别中每个类别在所述学生模型对应的检测对象数量；

6、基于每个类别在所述教师模型对应的检测对象数量以及每个类别在所述学生模型对应的检测对象数量，确定每个类别的概率阈值；

7、基于所述教师模型对应的分类参考信息和每个类别的概率阈值，为所述学生模型生成所述无标签图像对应的伪标签。

8、可以看出，本申请实施例中，针对包括教师模型和学生模型的半监督目标检测框架，基于教师模型和学生模型各自对同一无标签图像进行分类识别所得的分类参考信息，统计各个模型各自对应于同一类别的检测对象数量，可以评估出教师模型和学生模型分别对同一类别的学习状态(或者学习难度)，从而确定出适应于各个类别的概率阈值；进一步，利用教师模型对应的分类参考信息和每个类别的概率阈值，为学生模型生成无标签图像对应的伪标签，可以避免困难类别的检测对象被大量过滤，缓解学生模型对不同类别的学习不平衡的问题，从而提高具有半监督目标检测框架的图像分类模型的训练效果，使得图像分类模型具有较高的分类准确率。

9、第二方面，本申请实施例提供一种图像分类模型的训练方法，所述训练方法用于训练具有半监督目标检测架构的图像分类模型，所述图像分类模型包括教师模型和学生模型，所述训练方法包括：

10、获取用于训练所述图像分类模型的图像集合，所述图像集合包括有标签图像和无标签图像，以及获取所述有标签图像对应的类别标签和所述无标签图像对应的伪标签，所述无标签图像对应的伪标签为基于第一方面所述的标签生成方法生成的；

11、通过所述学生模型，分别对所述有标签图像和所述无标签图像进行分类识别，得到所述有标签图像对应的目标分类参考信息和所述无标签图像对应的目标分类参考信息；

12、基于所述有标签图像对应的目标分类参考信息、所述有标签图像对应的类别标签、所述无标签图像对应的目标分类参考信息以及所述无标签图像对应的伪标签，调整所述图像分类模型的模型参数。

13、可以看出，本申请实施例中，针对具有半监督目标检测框架的图像分类模型，通过图像分类模型中的学生模型，分别对图像集合中的有标签图像和无标签图像进行分类识别，得到有标签图像对应的分类参考信息和无标签图像对应的分类参考信息，然后利用本申请实施例提供的标签生成方法为学生模型生成的无标签图像对应的伪标签为学生模型的学习过程提供指导，基于图像集合中的每个图像对应的分类参考信息、图像集合中的有标签图像对应的类别标签以及无标签图像对应的伪标签，调整图像分类模型的模型参数，有利于缓解学生模型对不同类别的学习不平衡的问题，从而提高具有半监督目标检测框架的图像分类模型的训练效果，使得图像分类模型具有较高的分类准确率。

14、第三方面，本申请实施例提供一种图像分类方法，包括：

15、通过图像分类模型中的目标模型，对待处理图像进行分类识别，得到所述目标模型对应的分类参考信息；

16、基于所述目标模型对应的分类参考信息，确定所述待处理图像包含的检测对象及所述检测对象所属的类别；

17、其中，所述图像分类模型为具有半监督目标检测框架的模型，所述图像分类模型包括教师模型和学生模型，所述目标模型包括所述教师模型和/或所述学生模型；

18、所述图像分类模型为基于图像集合中每个图像的目标分类参考信息、所述图像集合中有标签图像对应的类别标签以及无标签图像对应的伪标签训练得到的；所述每个图像的目标分类参考信息是通过所述图像分类模型中的学生模型对所述图像集合中每个图像进行分类识别得到的；所述无标签图像对应的伪标签是通过第一方面方法确定的。

19、可以看出，本申请实施例中，针对具有半监督目标检测框架的图像分类模型，由于在图像分类模型的半监督学习过程中采用的无标签图像对应的伪标签是教师模型和学生模型分别对各个类别的学习状态(或者学习难度)动态评估得到的，有利于缓解学生模型对不同类别的学习不平衡的问题，进而得到训练出的图像分类模型具有较高的分类准确率；进一步，利用图像分类模型对待处理图像进行分类识别，有助于提高图像分类结果的准确性和可靠性。

20、第四方面，本申请实施例提供一种标签生成装置，所述标签生成装置应用于半监督目标检测架构中，所述半监督目标检测架构包括教师模型和学生模型，所述标签生成装置包括：

21、分类单元，用于通过所述教师模型对无标签图像进行分类识别，得到所述教师模型对应的分类参考信息，以及通过所述学生模型对所述无标签图像进行分类识别，得到所述学生模型对应的本文档来自技高网...

【技术保护点】

1.一种标签生成方法，其特征在于，所述标签生成方法应用于半监督目标检测架构中，所述半监督目标检测架构包括教师模型和学生模型，所述标签生成方法包括：

2.根据权利要求1所述的方法，其特征在于，所述基于每个类别在所述教师模型对应的检测对象数量以及每个类别在所述学生模型对应的检测对象数量，确定每个类别的概率阈值，包括：

3.根据权利要求2所述的方法，其特征在于，所述基于每个类别在所述教师模型对应的检测对象数量以及每个类别在所述学生模型对应的检测对象数量，确定每个类别的学习率，包括：

4.根据权利要求2所述的方法，其特征在于，所述基于每个类别的学习率，确定每个类别的概率阈值，包括：

5.根据权利要求2所述的方法，其特征在于，在基于每个类别在所述教师模型对应的检测对象数量以及每个类别在所述学生模型对应的检测对象数量，确定每个类别的概率阈值之前，所述方法还包括：

6.根据权利要求1所述的方法，其特征在于，所述基于所述教师模型对应的分类参考信息，确定所述多个类别中每个类别在所述教师模型对应的检测对象数量，以及基于所述学生模型对应的分类

7.根据权利要求1所述的方法，其特征在于，所述基于所述教师模型对应的分类参考信息和每个类别的概率阈值，为所述学生模型生成所述无标签图像对应的伪标签，包括：

8.一种图像分类模型的训练方法，其特征在于，所述训练方法用于训练具有半监督目标检测架构的图像分类模型，所述图像分类模型包括教师模型和学生模型，所述训练方法包括：

9.根据权利要求8所述的方法，其特征在于，所述图像分类模型的模型参数包括所述学生模型的模型参数；

10.根据权利要求9所述的方法，其特征在于，所述图像分类模型的模型参数还包括所述学生模型的模型参数；所述方法还包括：

11.一种图像分类方法，其特征在于，包括：

12.一种标签生成装置，其特征在于，所述标签生成装置应用于半监督目标检测架构中，所述半监督目标检测架构包括教师模型和学生模型，所述标签生成装置包括：

13.一种图像分类模型的训练装置，其特征在于，所述训练装置用于训练具有半监督目标检测架构的图像分类模型，所述图像分类模型包括教师模型和学生模型，所述训练装置包括：

14.一种图像分类装置，其特征在于，包括：

15.一种电子设备，其特征在于，包括：

16.一种计算机可读存储介质，其特征在于，当所述存储介质中的指令由电子设备的处理器执行时，使得电子设备执行如权利要求1至7中任一项所述的方法；或者，使得电子设备执行如权利要求8至10中任一项所述的方法；或者，使得电子设备执行如权利要求11所述的方法。

...

【技术特征摘要】

4.根据权利要求2所述的方法，其特征在于，所述基于每个类别的学习率，确定每个类别的概率阈值，包括：

6.根据权利要求1所述的方法，其特征在于，所述基于所述教师模型对应的分类参考信息，确定所述多个类别中每个类别在所述教师模型对应的检测对象数量，以及基于所述学生模型对应的分类参考信息，确定所述多个类别中每个类别在所述学生模型对应的检测对象数量，包括：

7.根据权利要求1所述的方法，其特征在于，所述基于所述教师模型对应的分类参考信息和每个类别的概率阈值，为所述学生模型生成所述无...

【专利技术属性】
技术研发人员：吕永春，朱徽，周迅溢，蒋宁，吴海英，
申请(专利权)人：马上消费金融股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人