基于置信学习的目标检测图像标签去噪方法技术

技术编号：40457996 阅读：8 留言：0更新日期：2024-02-22 23:14

本发明专利技术公开了一种基于置信学习的目标检测图像标签去噪方法。在神经网络的训练阶段，噪声标签会阻碍模型拟合到最优解。置信学习是一个在分类任务中应用广泛的标签去噪方法，然而在目标检测领域还没有相对成熟的方案。本发明专利技术基于目标检测模型对数据集的检测结果，通过样本匹配和估计前景背景概率，分别对数据集类别和前景背景类进行置信学习计算，成功将置信学习推广到了目标检测。使用瑕疵检测数据集进行实验，本发明专利技术能够快速准确地识别噪声标签，精确率为70.91％；本发明专利技术也可用于带噪学习，通过交叉验证去除训练集的噪声标签，能够明显提升模型性能，经实测mAP50提高了4.4％。本发明专利技术适用于各种目标检测算法，是一个普适性较好的目标检测图像标签去噪方案。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于计算机视觉领域，尤其涉及一种基于置信学习的目标检测图像标签去噪方法。

技术介绍

1、目前，深度学习已经广泛应用于人们生产生活的方方面面，这离不开大量标注数据进行监督训练。然而在数据集的海量标签中，标注出错的情况是经常发生的，目标检测数据集中错误标注的情况尤为严重，因为检测任务不仅需要对目标的类别进行划分，还需要用边界框来确定目标位置，此时标签出错的概率就大大增加了。这些噪声标签会在深度神经网络的训练过程中起到一定程度的误导作用，可能导致最终模型性能不佳。

2、对于识别分类数据集中的噪声标签，研究人员已经提出了各种各样的解决方案，主要可以分为基于训练过程的方法和基于统计分布的方法。

3、基于训练过程的方法通常在网络训练阶段通过loss大小判别噪声标签，这类方法认为即使数据集中存在噪声标签，dnn在训练初期也只会从干净的样本中学习信息，当迭代次数足够大时才会开始拟合噪声数据。因此让神经网络先记住loss较小的简单样本，将这些标签视为是干净的，然后再逐渐学习困难样本、识别噪声标签是可行思路。co-teaching通过并行训练两个网络，每个网络将它认为标签干净，即loss较小的样本交给另一个网络学习，这样不断交叉更新参数，通过两个分类器从不同的角度过滤噪声标签。该方法的缺陷也是显而易见的，就同时训练两个网络，训练速度缓慢并且需要大量内存。o2u-net认为在从欠拟合到过拟合的整个训练过程当中，噪声数据loss的均值和方差会明显大于干净数据，因此通过设计循环学习率策略，使网络在欠拟合到过拟合的过程中多

4、基于统计分布的方法通过估计噪声分布和标签置信度来剔除噪声标签，而不着眼于特殊的训练策略。大多数方法通过预测噪声率来剔除噪声标签，incv对数据集进行迭代交叉验证，在每轮迭代中估计噪声转移概率矩阵并剔除一部分噪声，最终获得干净的数据集。然而，置信学习(confident learning)认为噪声率无法直接反映每个类别的噪声标签数量，并首次提出通过估计整个数据集中给定标签和实际标签的联合分布来剔除噪声标签。对于某批带噪样本，该方法只需要样本外的预测概率和标签就能计算联合分布矩阵，在不同噪声率下，置信学习的准确率都要高于incv、co-teaching等优秀方法。置信学习的优势还在于能够兼容各种分类模型，并且算法无需迭代，速度很快。

5、上述方法在分类任务中都有着各自的优势并取得了很好的效果，然而在目标检测领域，相关工作是非常少的。有研究人员参考了co-teaching的思想，在训练faster r-cnn时使用双检测头互相参考来校正标签类别和边界框，经过多次迭代得到可靠模型和干净数据集，计算量比训练两个完整网络要小得多。通常情况下，该方法能够很好地校正噪声标签，但当一个标签包含多个同类物体时，反而会将边界框向错误的地方修改。目前在该领域还没有相对成熟的方案来解决目标检测数据集中的噪声标签问题。

技术实现思路

1、为了解决
技术介绍
中存在的问题，本专利技术的目的在于，提供一种快速有效且泛用性好的方法来识别目标检测数据集中的噪声标签。为此，本专利技术采用如下技术方案：

2、基于置信学习的目标检测图像标签去噪方法，包含训练目标检测模型、计算检测结果、样本匹配、估计前景背景概率、置信学习；所述图像标签去噪方法按如下步骤进行：

3、步骤(1)，训练目标检测模型：选择需要进行图像标签去噪处理的目标检测数据集，数据集应具有标签，标签包含m个类别，m为大于0的整数；将数据集划分为训练集、验证集和测试集；使用目标检测算法在训练集上训练模型；

4、步骤(2)，计算检测结果：使用步骤(1)训练完成的所述目标检测模型进行推理，计算测试集的检测结果，不进行得分筛选，直接经过非极大值抑制获得不同尺度下的预测框，所述预测框的信息包括预测框的位置及所有类别的预测概率；

5、步骤(3)，样本匹配：以iou和置信度为标准将检测结果和标签进行匹配，此时匹配结果可以分为两部分：检测结果和标签成功匹配的，为匹配框；未能成功匹配，即预测框没有与之对应的标签框，或标签框没有与之对应的预测框，为失配框；

6、步骤(4)，估计前景背景概率：在数据集类别的基础上引入前景类和背景类；对于所述匹配框，根据标签和所述目标检测模型的预测概率，通过累乘的方式估计每个预测框作为前景和背景的概率；对于所述失配框，手动添加标签和前景背景概率；所述前景背景概率包括四种情况，分别是：标签为前景时的前景概率，标签为前景时的背景概率，标签为背景时的前景概率，标签为背景时的背景概率；

7、步骤(5)，置信学习：分别进行数据集类别的置信学习和前景背景类的置信学习；所述数据集类别的置信学习，使用匹配框直接进行计算，得到联合分布矩阵qdc，使用该矩阵识别到的噪声标签集合为sdc；所述前景背景类的置信学习，根据估计的前景概率和背景概率，使用匹配框和失配框共同计算，得到联合分布矩阵qfb，使用该矩阵识别到的噪声标签集合为sfb；最终取并集sdc∪sfb得到整个测试集的噪声标签。

8、在采用上述技术方案的同时，本专利技术还可以采用或者组合采用以下进一步的技术方案：

9、作为本专利技术的优选技术方案：在步骤(1)中，若要识别训练集中的噪声标签，为了保证用于计算检测结果的模型未接触过相关数据，防止模型对噪声标签过拟合，需要在训练过程中使用k-fold交叉验证；具体操作为将训练集等分为k个子集，k为大于1的整数；分别将1个子集作为验证集，其余(k-1)个子集作为训练集，并行训练k个独立的模型以得到验证集的检测结果，最后将k个验证集的检测结果合并，得到整个训练集的样本外检测结果。

10、作为本专利技术的优选技术方案：在步骤(3)中，通过累乘的方式计算目标不属于数据集中任何类别的概率，作为背景概率；在计算所述前景背景概率时，基于目标的标签设置了α与β两个超参数对概率分布进行修正，并根据数据集特性和模型可靠性进行调整；所述标签为前景时的前景概率为：

11、

12、所述标签为前景时的背景概率为：

13、

14、所述标签为背景时的前景概率为：

15、

16、所述标签为背景时的背景概率为：

17、

18、其中，p为所求前景概率或背景概率，x为样本，y为样本的类别，fg为前景类，bg为背景类，x为数据集，为标签类别，为模型预测样本x属于类别i的概率，[m]为m个类别的集合。

19、作为本专利技术的优选技术方案：在步骤(4)中，在所有iou大于设定阈值的预测框中，选择iou和置信度乘积最大的样本进行匹配。

20、作为本专利技术的优选技术方案：在步骤(5)中，分别对数据集类别和前景背景类进行置信学习的计算；所述置信学习的流程为首先通过预测概率为每个类别j分别计算置信度阈值tj：本文档来自技高网...

【技术保护点】

1.基于置信学习的目标检测图像标签去噪方法，其特征在于：

2.根据权利要求1所述的基于置信学习的目标检测图像标签去噪方法，其特征在于，所述步骤(1)中，若要识别训练集中的噪声标签，为了保证用于计算检测结果的模型未接触过相关数据，防止模型对噪声标签过拟合，需要在训练过程中使用K-Fold交叉验证；具体操作为将训练集等分为K个子集，K为大于1的整数；分别将1个子集作为验证集，其余(K-1)个子集作为训练集，并行训练K个独立的模型以得到验证集的检测结果，最后将K个验证集的检测结果合并，得到整个训练集的样本外检测结果。

3.根据权利要求1所述的基于置信学习的目标检测图像标签去噪方法，其特征在于，所述步骤(3)中，通过累乘的方式计算目标不属于数据集中任何类别的概率，作为背景概率；在计算所述前景背景概率时，基于目标的标签设置了α与β两个超参数对概率分布进行修正，并根据数据集特性和模型可靠性进行调整；所述标签为前景时的前景概率为：

4.根据权利要求1所述的基于置信学习的目标检测图像标签去噪方法，其特征在于，所述步骤(4)中，在所有IoU大于设定阈值的预测框中

5.根据权利要求1所述的基于置信学习的目标检测图像标签去噪方法，其特征在于，所述步骤(5)中，分别对数据集类别和前景背景类进行置信学习的计算；所述置信学习的流程为首先通过预测概率为每个类别j分别计算置信度阈值tj：

...

【技术特征摘要】

1.基于置信学习的目标检测图像标签去噪方法，其特征在于：

2.根据权利要求1所述的基于置信学习的目标检测图像标签去噪方法，其特征在于，所述步骤(1)中，若要识别训练集中的噪声标签，为了保证用于计算检测结果的模型未接触过相关数据，防止模型对噪声标签过拟合，需要在训练过程中使用k-fold交叉验证；具体操作为将训练集等分为k个子集，k为大于1的整数；分别将1个子集作为验证集，其余(k-1)个子集作为训练集，并行训练k个独立的模型以得到验证集的检测结果，最后将k个验证集的检测结果合并，得到整个训练集的样本外检测结果。

3.根据权利要求1所述的基于置信学习的目标检测图像标签去噪方法，其特征在于，所述步骤(3)中...

【专利技术属性】
技术研发人员：吴炳文，陈金水，卢建刚，
申请(专利权)人：浙江大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人