面向视觉检测的目标检测模型训练方法及目标检测方法技术

技术编号:34487878 阅读:15 留言:0更新日期:2022-08-10 09:05
本发明专利技术公开了一种面向视觉检测的目标检测模型训练方法及目标检测方法。本训练方法为:1)每次迭代训练时选取多个标注数据和无标注数据;2)将标注的图像样本数据输入目标检测模型进行训练,获取每一标注的图像样本数据的预测结果;3)根据预测结果与对应的标注进行损失计算,得到监督训练的损失Ls;4)对每一无标注的图像样本数据分别进行弱增强和强增强;5)将弱增强样本数据输入目标检测模型进行预测,将所得预测结果作为对应强增强样本数据的伪标注;6)将强增强样本数据输入目标检测模型进行预测,根据所得预测结果与对应伪标注进行损失计算,得到无监督训练的损失Lu;7)根据Ls和Lu调整目标检测模型的参数。Lu调整目标检测模型的参数。Lu调整目标检测模型的参数。

【技术实现步骤摘要】
面向视觉检测的目标检测模型训练方法及目标检测方法


[0001]本专利技术涉及半监督学习与目标检测领域,具体为一种面向视觉检测的目标检测模型训练方法及目标检测方法。

技术介绍

[0002]目前,目标检测模型大多数为全监督模型,如“你只看一次”(You Only Look Once,YOLO)系列的目标检测模型。YOLO系列是偏向于速度的单阶段目标检测模型,将目标检测统一为一个回归问题,大量减少预测所需要的参数,因而能够获得高速检测的性能,但是检测精度会因为减少了参数量而有一定的下降。目前YOLO系列最新的“你只看一次,X版本”(You Only Look Once X,YOLOX)拥有检测速度快,精度高的特点,但是仍然需要大量人工标注的数据进行训练,数据的标注质量对模型的精度也有很大的影响。受到人工标注的局限,全监督训练所用的标注数据必定存在一些缺陷,例如标注的错标和漏标。所以,减少YOLOX训练所需的标注数据量和提高YOLOX对标注数据容错性的工作仍然需要继续进行。
[0003]半监督学习是使用少量标注数据和大量无标注数据进行训练的一种学习方式,被广泛使用于难以获得标注数据和标注数据获取成本大的任务中。半监督学习的重点是如何最大限度使用无标注数据的信息,比较常用的方法有一致性约束和熵最小化两种。使用简单方法组合的半监督学习常在分类任务中减少训练标注和提高模型泛化性,但是在目标检测的任务中却很少使用。

技术实现思路

[0004]针对在手机外观缺陷检测中使用全监督目标检测模型需要耗费大量人力物力进行数据标注的问题,本专利技术提出了一种面向视觉检测的目标检测模型训练方法及目标检测方法;本专利技术基于半监督的目标检测训练模块Fix

YOLOX(Fixmatch

You Only Look Once X),使用少量的标注数据进行全监督训练,同时增加了使用伪标注和一致性正则化两个方法的半监督训练模块,利用无标注的数据避免全监督训练的过拟合,提升模型的泛化性和对标注数据的容错性。
[0005]本专利技术的技术方案为:
[0006]一种面向视觉检测的目标检测模型训练方法,其步骤包括:
[0007]1)每次迭代训练时选取一批样本数据;每批样本数据包括多个标注的图像样本数据和多个无标注的图像样本数据;
[0008]2)将标注的图像样本数据输入目标检测模型进行训练,获取每一标注的图像样本数据的预测结果;
[0009]3)根据标注的图像样本数据的预测结果与所述标注的图像样本数据对应的标注进行损失计算,得到监督训练的损失Ls;
[0010]4)对每一所述无标注的图像样本数据分别进行弱增强和强增强,得到对应的弱增强样本数据和强增强样本数据;
[0011]5)将所述弱增强样本数据输入所述目标检测模型进行预测,将所得预测结果作为对应强增强样本数据的伪标注;
[0012]6)将所述强增强样本数据输入所述目标检测模型进行预测,根据所得预测结果与所述强增强样本数据的伪标注进行损失计算,得到无监督训练的损失Lu;
[0013]7)根据监督训练的损失Ls和无监督训练的损失Lu综合计算所得损失值L
total
,并将其反向传播调整所述目标检测模型的参数。
[0014]进一步的,所述监督训练的损失Ls包括分类损失和目标位置损失;所述无监督训练的损失Lu包括分类损失和目标位置损失。
[0015]进一步的,使用交叉熵损失计算所述分类损失,使用IOU计算所述目标位置损失。
[0016]进一步的,L
total
=Ls+λLu;其中,λ是一个超参数,表示未标注数据损失的在总损失中的权重。
[0017]进一步的,根据每批样本数据标注的图像样本数据数量和无标注的图像样本数据数量决定λ值。
[0018]进一步的,每批样本数据包括B个标注的图像样本数据和μB个未标注的图像样本数据;μ为大于1的比例系数。
[0019]进一步的,所述弱增强为对图像的亮度、对比度、饱和度以及色相进行随机变换,令变换后的图片与原图有所差异但是不失真;所述强增强是指图片加入高斯噪声,令图片产生一定程度的失真。
[0020]进一步的,所述目标检测模型为面向视觉检测的YOLOX模型。
[0021]一种面向视觉检测的目标检测方法,其特征在于,对于一待检测图像,将其输入训练后的目标检测模型中,得到该待检测图像中的目标及其位置。
[0022]进一步的,所述待检测图像为手机外观图像。
[0023]为了减少全监督模型的标注量,本文在YOLOX中加入了半监督训练模块,主要为新的数据增强,伪标注和一致性正则化三个方面:
[0024](1)数据增强
[0025]半监督模块设置了强弱两种不同的类型的数据增强方法,并将其集成在同一个数据加载类(Dataloader)中,同时因为YOLOX本身的Dataloader带有马赛克(Mosaic)数据增强方式,为了避免监督和半监督模块使用同样的增强方式相互产生影响导致过拟合,半监督模块的数据增强中不再使用Mosaic增强方式。固定匹配(Fixmatch)算法中使用的随机数据增强方法只适用于单一大型目标的分类,对于目标小,数量多的目标检测任务并不适用,所以本文重新改进了数据增强的方法。
[0026]半监督模块使用的强弱两种监督方式都是对同一个样本进行增强,以供后续的一致性正则化使用。弱增强主要对样本图片的亮度,对比度,饱和度和色相进行随机变换,令图片与原图有所差异但是不至于失真。弱增强参数的随机变换范围如表1。
[0027]表1.弱增强参数范围
[0028][0029]强增强主要针对图片加入高斯噪声,高斯噪声是工业成像过程中因为不良照明或者高温引起的传感器噪声,令图片产生一定程度的失真。强增强使用随机生成高斯噪声模拟现实生产环境中可能产生的影响。高斯噪声参数变动范围如表2。
[0030]表2.强增强参数范围
[0031][0032](2)伪标注
[0033]伪标注方法是指网络经过标注数据的预训练后,通过给无标注的数据打上伪标注,并使用带有伪标注的数据和原始标注数据重新对网络进行训练和调整的方法。伪标注训练的方法能够尽可能利用到无标注的数据,通过与标注数据的结合重训练避免模型的在少量标注数据下过拟合的情况。半监督模块在训练时会把弱增强后的图片输入网络,获取置信度高的结果作为弱增强图片的标注。伪标注技术的好处是可以节约大量用于标注数据的人力物力,同时用无标注数据为模型提高泛化性,避免少量标注数据单独训练下产生的过拟合。然而,无标注数据在训练时容易产生错误的标注,影响模型的收敛速度,所以还需要其他方法对预测出来的标注进行校正。
[0034]3)一致性正则化
[0035]半监督训练的模块在获得弱增强数据的伪标注后,会再通过检测网络获取强增强数据的标注,并使用一致性正则化拟合两者。一致性正则化训练思想认为:网络对于一个样本本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种面向视觉检测的目标检测模型训练方法,其步骤包括:1)每次迭代训练时选取一批样本数据;每批样本数据包括多个标注的图像样本数据和多个无标注的图像样本数据;2)将标注的图像样本数据输入目标检测模型进行训练,获取每一标注的图像样本数据的预测结果;3)根据标注的图像样本数据的预测结果与所述标注的图像样本数据对应的标注进行损失计算,得到监督训练的损失Ls;4)对每一所述无标注的图像样本数据分别进行弱增强和强增强,得到对应的弱增强样本数据和强增强样本数据;5)将所述弱增强样本数据输入所述目标检测模型进行预测,将所得预测结果作为对应强增强样本数据的伪标注;6)将所述强增强样本数据输入所述目标检测模型进行预测,根据所得预测结果与所述强增强样本数据的伪标注进行损失计算,得到无监督训练的损失Lu;7)根据监督训练的损失Ls和无监督训练的损失Lu综合计算所得损失值L
total
,并将其反向传播调整所述目标检测模型的参数。2.根据权利要求1所述的方法,其特征在于,所述监督训练的损失Ls包括分类损失和目标位置损失;所述无监督训练的损失Lu包括分类损失和目标位置损失。3.根据权利要求2所述的方法,其特征...

【专利技术属性】
技术研发人员:杨戈周祺峰
申请(专利权)人:北京师范大学珠海校区
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1