图像处理方法、图像处理系统及计算机可读介质技术方案

技术编号：40995677 阅读：4 留言：0更新日期：2024-04-18 21:36

本申请实施例提供一种图像处理方法、图像处理系统及计算机可读介质，用以解决现有的基于单正标签的多标签分类方法分类性能不佳的技术问题。该图像处理方法包括优化第一分类器，得到第二分类器。以及，优化第二分类器，得到第三分类器。这样，完成不同的训练阶段的构建。通过构建第一伪标签和第二伪标签，使得不同训练阶段的伪标签不同。使用第一损失函数优化第一分类器，使用第二损失函数和第三损失函数优化第二分类器。实现损失函数的动态调整。相比第一伪标签，第二伪标签通过第二分类器输出的第一预测概率得到，第二伪标签更加准确。这样，通过在多个训练阶段，构建越来越准确的伪标签、动态调整损失函数，提升分类性能。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及图像处理系统，尤其涉及一种图像处理方法、图像处理系统及计算机可读介质。

技术介绍

1、图像分类，旨在将不同的图片划分在不同的类别。当一张图片拥有多个物体或属性时，需要根据多个物体或属性分别进行划分。这就需要对图片的每个物体或属性进行标注。人工标注消耗人力，且标注效率低、成本高。图像多标签分类(multi-labelclassification)方法，能够对图片的多个类别标签进行自动化识别，极大的提升分类速度。

2、基于单正标签的多标签分类方法，能够在图像训练集缺失标签的情况下，完成多标签分类。单正标签，是缺失标签的极限情况，即每张图片仅已知一个正标签，其余标签均未知。利用单正标签进行多标签分类时，通常假设未知标签为负标签。

3、然而，正标签在全部标签中占比较小，将未知标签假设为负标签会导致假负标签。即实际为正标签，但被假设为负标签。虽然假负标签的数量很少，但这些噪声会造成分类性能不佳的问题。

技术实现思路

1、本申请实施例提供一种图像处理方法、图像处理系统及计算机可读介质，用以解决现有的基于单正标签的多标签分类方法分类性能不佳的技术问题。

2、为达到上述目的，本申请的实施例采用如下技术方案：

3、第一方面，提供一种图像处理方法，该图像处理方法包括：构建单正标签图像集的第一伪标签；将单正标签图像集输入第一分类器，得到类别概率向量；根据类别概率向量和第一伪标签，计算第一损失函数；根据第一损失函数，优化第一分类器，得到第二分类器；

4、基于上述本申请实施例提供的图像处理方法，可知，该图像处理方法包括优化第一分类器，得到第二分类器。以及，优化第二分类器，得到第三分类器。这样，完成不同的训练阶段的构建。通过构建第一伪标签和第二伪标签，使得不同训练阶段的伪标签不同。使用第一损失函数优化第一分类器，得到第二分类器。以及，使用第二损失函数和第三损失函数优化第二分类器，得到第三分类器。可见，该图像处理方法中不同的训练阶段损失函数不同，实现损失函数的动态调整。相比第一伪标签，第二伪标签通过第二分类器输出的第一预测概率得到，第二伪标签更加准确。这样，通过在多个训练阶段，构建越来越准确的伪标签，以及动态调整损失函数，提升分类性能。

5、在第一方面可行的实现方式中，图像处理方法还包括：将单正标签图像集输入第三分类器，得到第三预测概率和第四预测概率；根据第三预测概率，构建第三伪标签；根据第三预测概率和第三伪标签，计算第四损失函数；以及，根据第四预测概率和第二伪标签，计算第五损失函数；根据第四损失函数和第五损失函数，优化第三分类器，得到第四分类器。

6、这样，构建三个图像训练阶段。每个图像训练阶段通过构建不同的伪标签作为学习目标。随着第一伪标签、第二伪标签和第三伪标签越来越准确，提升分类性能。减少单正标签数据给模型带来的累积误差，提高模型的准确率和泛化能力。

7、在第一方面可行的实现方式中，在执行将单正标签图像集输入第一分类器，得到类别概率向量的步骤时，图像处理方法还包括：对单正标签图像集中的图像进行弱数据增强，得到弱增强图像；将弱增强图像输入第一分类器。

8、在优化第一分类器的阶段，弱数据增强有利于第二分类器获得更好的分类性能。相比强数据增强，弱数据增强的效果更好。

9、在第一方面可行的实现方式中，在执行将单正标签图像集输入第二分类器，得到第一预测概率和第二预测概率的步骤时，图像处理方法还包括：将弱增强图像输入第二分类器，得到第一预测概率；对单正标签图像集中的图像进行强数据增强，得到强增强图像；将强增强图像输入第二分类器，得到第二预测概率。

10、这样，同时使用弱数据增强和强数据增强，能够提升分类性能。

11、在第一方面可行的实现方式中，在执行将单正标签图像集输入第三分类器，得到第三预测概率和第四预测概率的步骤时，图像处理方法还包括：对单正标签图像集中的图像进行弱数据增强，得到弱增强图像；将弱增强图像输入第三分类器，得到第三预测概率。

12、在第一方面可行的实现方式中，在执行将单正标签图像集输入第三分类器，得到第三预测概率和第四预测概率的步骤时，图像处理方法还包括：对单正标签图像集中的图像进行强数据增强，得到强增强图像；将强增强图像输入第三分类器，得到第四预测概率。

13、这样，使用强数据增强，可以提高分类器的鲁棒性，提升分类性能。

14、在第一方面可行的实现方式中，在执行将单正标签图像集输入第三分类器，得到第三预测概率和第四预测概率的步骤时，图像处理方法还包括：对单正标签图像集中的图像进行弱数据增强，得到弱增强图像；将弱增强图像输入第三分类器，得到第三预测概率。对单正标签图像集中的图像进行强数据增强，得到强增强图像；将强增强图像输入第三分类器，得到第四预测概率。

15、这样，同时使用弱数据增强和强数据增强，能够提升分类性能。

16、在第一方面可行的实现方式中，构建第一伪标签时，图像处理方法还包括：将未知标签转换为负标签。

17、在第一方面可行的实现方式中，在执行根据第一预测概率，构建第二伪标签的步骤时，图像处理方法还包括：若第一预测概率大于正阈值，则第二伪标签的值为一；若第一预测概率小于负阈值，则第二伪标签的值为零；若第一预测概率小于等于正阈值，且大于等于负阈值，则第二伪标签的值为空。

18、在第一方面可行的实现方式中，第二伪标签中第i个元素的公式如下：

19、

20、其中，表示为第一预测概率，即第二分类器对弱增强图像预测的第i个类别标签的概率值；δ+表示为正阈值；δ-表示为负阈值。

21、在一些实施例中，正阈值δ+和负阈值δ-设置为非对称值。

22、这样，其余低置信度的预测类别被忽略，能够更好地平衡正负伪标签的数量和质量。可以理解的是，低置信度的预测类别构建的伪标签通常不准确。

23、在第一方面可行的实现方式中，在执行根据第三预测概率，构建第三伪标签的步骤时，图像处理方法还包括：若第一伪标签的值为一，则第三伪标签的值为一；若第一伪标签的值不为一，则第三伪标签的值为第三预测概率的值。

24、在第一方面可行的实现方式中，第三伪标签中第i个元素的公式如下：

25、

26、其中，表示为第一伪标签中的第i个元素；表示为第三预测概率，即第三分类器对弱增强图像预测的第i个类别标签的概率值。

27、这样，我们保留已知正标签，对未知标签，用对弱数据增强图像的预测概率值作为伪标签。相比于直接假设为负标签，概率值能够更准确描述类别信息。

28、本文档来自技高网...

【技术保护点】

1.一种图像处理方法，其特征在于，包括：

2.根据权利要求1所述的图像处理方法，其特征在于，所述图像处理方法还包括：

3.根据权利要求1或2所述的图像处理方法，其特征在于，在执行所述将所述单正标签图像集输入所述第一分类器，得到所述类别概率向量的步骤时，所述图像处理方法还包括：

4.根据权利要求3所述的图像处理方法，其特征在于，在执行所述将所述单正标签图像集输入所述第二分类器，得到所述第一预测概率和所述第二预测概率的步骤时，所述图像处理方法还包括：

5.根据权利要求2所述的图像处理方法，其特征在于，在执行所述将所述单正标签图像集输入所述第三分类器，得到所述第三预测概率和所述第四预测概率的步骤时，所述图像处理方法还包括：

6.根据权利要求5所述的图像处理方法，其特征在于，在执行所述将所述单正标签图像集输入所述第三分类器，得到所述第三预测概率和所述第四预测概率的步骤时，所述图像处理方法还包括：

7.根据权利要求1或2所述的图像处理方法，其特征在于，在执行根据所述第一预测概率，构建所述第二伪标签的步骤时，所述图像处理方法还包括：

8.根据权利要求2所述的图像处理方法，其特征在于，在执行所述根据所述第三预测概率，构建所述第三伪标签的步骤时，所述图像处理方法还包括：

9.一种图像处理系统，其特征在于，所述图像处理系统包括：

10.一种计算机可读介质，其特征在于，其上存储有计算机程序指令，所述计算机程序指令可被处理器执行以实现如权利要求1至8中任一项所述的方法。

...

【技术特征摘要】

1.一种图像处理方法，其特征在于，包括：

2.根据权利要求1所述的图像处理方法，其特征在于，所述图像处理方法还包括：

6...

【专利技术属性】
技术研发人员：赵俊杰，熊伟，徐俊，高龙文，
申请(专利权)人：上海哔哩哔哩科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人