基于自训练和标签抗噪的图像中弱目标的检测方法及系统技术方案

技术编号:34856190 阅读:56 留言:0更新日期:2022-09-08 07:57
本发明专利技术属于目标检测相关技术领域,其公开了一种基于自训练和标签抗噪的图像中弱目标的检测方法及系统,方法包括:获取并预处理包括有标签图像样本和无标签图像样本的目标检测数据集;为有标签图像样本和无标签图像样本生成候选框;将有标签图像样本输入至基于MIL的弱监督目标检测模型,得到初步训练完成的弱监督目标检测模型;采用初步训练完成的弱监督目标检测模型对无标签图像样本进行预测并筛选,得到伪标签;采用有标签图像样本和伪标签的无标签图像样本对初步训练完成的模型再次训练,得到最终训练完成的模型;将待检测图像输入最终训练完成的模型即可实现弱目标的检测。本申请避免对高质量标签的依赖,提高了图像中弱目标检测的精度和效率。像中弱目标检测的精度和效率。像中弱目标检测的精度和效率。

【技术实现步骤摘要】
基于自训练和标签抗噪的图像中弱目标的检测方法及系统


[0001]本专利技术属于弱监督目标检测相关
,更具体地,涉及一种基于自训练和标签抗噪的图像中弱目标的检测方法及系统。

技术介绍

[0002]目标检测包括分类和回归两类任务,目的在于根据图像信息得到目标物体的分类信息以及位置信息,目标检测在人脸支付、智能辅助驾驶、自动驾驶、违章查询、关键通道检测、广告检测等方便有着广泛的应用和重要的意义,已经成为计算机视觉领域最重要的研究方向之一。
[0003]随着深度学习的发展,研究者们开始探索使用深度学习进行目标检测,深度学习使用数据自动学习如何进行深度特征提取而不是由开发者手动进行,因此,深度学习在目标检测领域表现出优秀的性能,成为了目标检测任务中研究者使用最主要的算法。在目标检测领域,基于深度学习的VGG

16、YOLO、SSD、Faster

RCNN等方法成为现在研究的主流。基于深度学习的目标检测对样本标签的质量要求非常高,既需要样本中目标的分类标签还需要目标的位置标签,然而,给样本生成高质量标签需要消耗大量的时间和精力。
[0004]在现实工作中,大多数数据集并不能满足基于深度学习的目标检测的要求,因为其样本标签只包含了样本的分类标签,甚至没有标签。因此,开发一种只需要分类标签的目标检测技术,即弱监督目标检测技术成为了学者研究的重点。现有的弱监督目标检测的主要问题在于,由于只使用了样本的分类标签训练模型,其性能达不到实际应用的要求。
[0005]提供弱监督目标检测性能主要有以下几种思路:
[0006](1)提高模型特征提取能力;(2)提高目标定位以及分类能力;(3)优化自训练算法。自训练算法具体方法为使用在有标签样本上训练的弱监督目标模型给无标签样本生成伪标签,再使用带有伪标签的无标签样本和有标签样本共同训练弱监督目标检测,这样使用无标签样本提高弱监督目标检测的性能。然而,自训练算法需要生成和使用伪标签,而伪标签和人工标记的标签相比包含很多错误信息,即标签噪声。标签噪声对于训练过程是一个巨大的干扰,因此检测精度不高,不能很好的识别图像中的弱目标。

技术实现思路

[0007]针对现有技术的以上缺陷或改进需求,本专利技术提供了一种基于自训练和标签抗噪的图像弱目标的检测方法及系统,本申请可以利用无标签图像数据进行图像中弱目标的检测,避免对高质量标签的依赖,提高了图像中弱目标检测的精度和效率。
[0008]为实现上述目的,按照本专利技术的一个方面,提供了一种基于自训练和标签抗噪的图像中弱目标的检测方法,所述方法包括:S1:获取包括有标签图像样本和无标签图像样本的目标检测数据集,其中,所述有标签图像样本为已知目标类别的图像样本;S2:对所述目标检测数据集进行预处理,得到预处理后的有标签图像样本和预处理后的无标签图像样本;S3:为所述预处理后的有标签图像样本和预处理后的无标签图像样本生成候选框以作
为待识别目标区域;S4:将步骤S3处理后的有标签图像样本作为输入,并将所述有标签图像样本的目标类别的概率作为输出对基于MIL的弱监督目标检测模型进行训练,得到初步训练完成的弱监督目标检测模型;S5:采用所述初步训练完成的弱监督目标检测模型对步骤S3处理后的无标签图像样本进行预测,得到预测结果;S6:将无标签图像样本的预测结果中属于目标类别的概率大于预设阈值的图像样本保留作为无标签图像样本的伪标签,将无标签图像样本中属于目标类别的概率小于预设阈值的图像样本舍弃;S7:将步骤S3处理后的有标签图像样本和带有伪标签的步骤S3处理后的无标签图像样本对所述初步训练完成的弱监督目标检测模型进行再次训练,当采用带有伪标签的预处理后的无标签图像样本进行训练时采用优化的损失函数来评判伪标签的标签概率与预测概率之间的差值,得到最终训练完成的弱监督目标检测模型;S8:将待检测的具有弱目标的图像输入最终训练完成的弱监督目标检测模型即可实现弱目标的检测。
[0009]优选地,步骤S7中,将步骤S3处理后的有标签图像样本和带有伪标签的步骤S3处理后的无标签图像样本对所述初步训练完成的弱监督目标检测模型进行再次训练具体为:训练过程中,当输入的图像样本为预处理后的有标签图像样本时,则使用交叉熵损失函数对初步训练完成的弱监督目标检测模型进行再次训练;当输入的图像样本为带有伪标签的步骤S3处理后的无标签图像样本时,使用优化的损失函数替代原有损失函数,所述优化的损失函数为:
[0010][0011]其中,为第j个无标签图像样本的损失值,α为衰减系数,β为补偿系数,C为总类别数量,c为类别序号,y
jc
为第j个预处理后的无标签样本中第c个类别的标签,为第j个预处理后的无标签图像样本包含类别c的概率。
[0012]优选地,步骤S6中具体为采用预设阈值对所述预测结果进行筛选,将预测结果中属于目标类别的概率大于预设阈值则为伪标签,将预测结果中属于目标类别的概率小于预设阈值则舍弃,伪标签y

i
的具体表达式为:
[0013]y

j
=[y

j1
,y

j2


,y

jc


y

jC
]∈R
C
×1[0014][0015]其中,y

jc
为第j个图像样本中第c个类别的伪标签,R
C
×1为C
×
1维的实数空间,C为类别总数,为第j个预处理后的无标签图像样本包含类别c的概率,其取值在区间[0,1]内,θ为预设阈值。
[0016]优选地,步骤S5中所述预测结果为每个标签包含预设目标类别的概率,预测结果的具体表达式为:
[0017][0018]其中,为所述初步训练完成的弱监督目标检测模型对第j个预处理后的无标签
图像样本的预测结果;为第j个预处理后的无标签图像样本包含类别c的概率,其取值在区间[0,1]内,R
C
×1为C
×
1维的实数空间。
[0019]优选地,所述预设阈值为0.6~0.99。
[0020]优选地,所述预处理包括高斯噪声、随机翻转以及尺寸缩放中的一种或多种操作。
[0021]优选地,采用选择性搜索算法为所述预处理后的有标签图像样本和预处理后的无标签图像样本生成候选框。
[0022]按照本专利技术的另一个方面,提供了一种基于自训练与标签抗噪的弱监督目标检测系统,所述系统包括:数据集获取单元:用于获取包括有标签图像样本和无标签图像样本的目标检测数据集,其中,所述有标签图像样本为已知目标类别的图像样本;预处理单元:用于对所述目标检测数据集进行预处理,得到预处理后的有标签图像样本和预处理后的无标签图像样本;候选框生成单元:用于采用选择性搜索算法为所述预处理后的有标签图像样本和预处理后的无标签图像样本本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于自训练和标签抗噪的图像中弱目标的检测方法,其特征在于,所述检测方法包括:S1:获取包括有标签图像样本和无标签图像样本的目标检测数据集,其中,所述有标签图像样本为已知目标类别的图像样本;S2:对所述目标检测数据集进行预处理,得到预处理后的有标签图像样本和预处理后的无标签图像样本;S3:为所述预处理后的有标签图像样本和预处理后的无标签图像样本生成候选框以作为待识别目标区域;S4:将步骤S3处理后的有标签图像样本作为输入,并将所述有标签图像样本对应的目标类别的概率作为输出对基于MIL的弱监督目标检测模型进行训练,得到初步训练完成的弱监督目标检测模型;S5:采用所述初步训练完成的弱监督目标检测模型对步骤S3处理后的无标签图像样本进行预测,得到预测结果;S6:将无标签图像样本的预测结果中属于目标类别的概率大于预设阈值的图像样本保留作为无标签图像样本的伪标签,将无标签图像样本中属于目标类别的概率小于预设阈值的图像样本舍弃;S7:将步骤S3处理后的有标签图像样本和带有伪标签的步骤S3处理后的无标签图像样本对所述初步训练完成的弱监督目标检测模型进行再次训练,当采用带有伪标签的预处理后的无标签图像样本进行训练时采用优化的损失函数来评判伪标签的标签概率与预测概率之间的差值,得到最终训练完成的弱监督目标检测模型;S8:将待检测的具有弱目标的图像输入最终训练完成的弱监督目标检测模型即可实现图像中弱目标的目标类别检测。2.根据权利要求1所述的检测方法,其特征在于,步骤S7中,将步骤S3处理后的有标签图像样本和带有伪标签的步骤S3处理后的无标签图像样本对所述初步训练完成的弱监督目标检测模型进行再次训练具体为:训练过程中,当输入的图像样本为步骤S3处理后的有标签图像样本时,则使用交叉熵损失函数对初步训练完成的弱监督目标检测模型进行再次训练;当输入的图像样本为带有伪标签的步骤S3处理后的无标签图像样本时,使用优化的损失函数替代原有损失函数,所述优化的损失函数为:其中,为第j个无标签图像样本的损失值,α为衰减系数,β为补偿系数,C为总类别数量,c为类别序号,y
jc
为第c个类别的标签,为第j个预处理后的无标签图像样本包含类别c的概率。3.根据权利要求1所述的检测方法,其特征在于,步骤S6中具体为采用预设阈值对所述预测结果进行筛选,将预测结果中属于目标类别的概率大于预设阈值的无标签样本作为伪标签,将预测结果中属于目标类别的概率小于预设阈值的无标签样本舍弃,伪标签y

i
的具
体表达式为:y

j
=[y

j1
,y

j2


,y

【专利技术属性】
技术研发人员:李新宇万宇森高亮高艺平
申请(专利权)人:华中科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1