面向视觉检测的目标检测模型训练方法及目标检测方法技术

技术编号：34487878 阅读：15 留言：0更新日期：2022-08-10 09:05

本发明专利技术公开了一种面向视觉检测的目标检测模型训练方法及目标检测方法。本训练方法为：1)每次迭代训练时选取多个标注数据和无标注数据；2)将标注的图像样本数据输入目标检测模型进行训练，获取每一标注的图像样本数据的预测结果；3)根据预测结果与对应的标注进行损失计算，得到监督训练的损失Ls；4)对每一无标注的图像样本数据分别进行弱增强和强增强；5)将弱增强样本数据输入目标检测模型进行预测，将所得预测结果作为对应强增强样本数据的伪标注；6)将强增强样本数据输入目标检测模型进行预测，根据所得预测结果与对应伪标注进行损失计算，得到无监督训练的损失Lu；7)根据Ls和Lu调整目标检测模型的参数。Lu调整目标检测模型的参数。Lu调整目标检测模型的参数。

全部详细技术资料下载

【技术实现步骤摘要】
面向视觉检测的目标检测模型训练方法及目标检测方法

[0001]本专利技术涉及半监督学习与目标检测领域，具体为一种面向视觉检测的目标检测模型训练方法及目标检测方法。

技术介绍

[0002]目前，目标检测模型大多数为全监督模型，如“你只看一次”(You Only Look Once,YOLO)系列的目标检测模型。YOLO系列是偏向于速度的单阶段目标检测模型，将目标检测统一为一个回归问题，大量减少预测所需要的参数，因而能够获得高速检测的性能，但是检测精度会因为减少了参数量而有一定的下降。目前YOLO系列最新的“你只看一次，X版本”(You Only Look Once X,YOLOX)拥有检测速度快，精度高的特点，但是仍然需要大量人工标注的数据进行训练，数据的标注质量对模型的精度也有很大的影响。受到人工标注的局限，全监督训练所用的标注数据必定存在一些缺陷，例如标注的错标和漏标。所以，减少YOLOX训练所需的标注数据量和提高YOLOX对标注数据容错性的工作仍然需要继续进行。
[0003]半监督学习是使用少量标注数据和大量无标注数据进行训练的一种学习方式，被广泛使用于难以获得标注数据和标注数据获取成本大的任务中。半监督学习的重点是如何最大限度使用无标注数据的信息，比较常用的方法有一致性约束和熵最小化两种。使用简单方法组合的半监督学习常在分类任务中减少训练标注和提高模型泛化性，但是在目标检测的任务中却很少使用。

技术实现思路

[0004]针对在手机外观缺陷检测中使用全监督目标检测模型需要耗费大量人力物力进...

【技术保护点】

【技术特征摘要】
1.一种面向视觉检测的目标检测模型训练方法，其步骤包括：1)每次迭代训练时选取一批样本数据；每批样本数据包括多个标注的图像样本数据和多个无标注的图像样本数据；2)将标注的图像样本数据输入目标检测模型进行训练，获取每一标注的图像样本数据的预测结果；3)根据标注的图像样本数据的预测结果与所述标注的图像样本数据对应的标注进行损失计算，得到监督训练的损失Ls；4)对每一所述无标注的图像样本数据分别进行弱增强和强增强，得到对应的弱增强样本数据和强增强样本数据；5)将所述弱增强样本数据输入所述目标检测模型进行预测，将所得预测结果作为对应强增强样本数据的伪标注；6)将所述强增强样本数据输入所述目标检测模型进行预测，根据所得预测结果与所述强增强样本数据的伪标注进行损失计算，得到无监督训练的损失Lu；7)根据监督训练的损失Ls和无监督训练的损失Lu综合计算所得损失值L
total
，并将其反向传播调整所述目标检测模型的参数。2.根据权利要求1所述的方法，其特征在于，所述监督训练的损失Ls包括分类损失和目标位置损失；所述无监督训练的损失Lu包括分类损失和目标位置损失。3.根据权利要求2所述的方法，其特征...

【专利技术属性】
技术研发人员：杨戈，周祺峰，
申请(专利权)人：北京师范大学珠海校区，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人