半监督目标检测方法、装置、计算机设备及存储介质制造方法及图纸

技术编号：41132907 阅读：2 留言：0更新日期：2024-04-30 18:03

本申请提出了一种半监督目标检测方法，包括：利用预设强数据增强方式和预设弱数据增强方式分别对无标签样本图像进行处理，获得强数据增强后的无标签样本图像和弱数据增强后的无标签样本图像；基于有标签样本图像对学生模型进行训练，获得学生模型对有标签样本图像的预测损失；根据学生模型对强数据增强后的无标签样本图像的输出以及教师模型对弱数据增强后的无标签样本图像的输出，计算回归损失和分类损失；根据预测损失、回归损失和分类损失获取损失函数值，并判断损失函数值是否收敛在预设范围内，若是，则完成目标检测模型的训练；将待测图像输入目标检测模型，得到待测图像的检测结果。如此，能够提升模型训练效果，提高检测结果的精度。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及图像，具体涉及一种半监督目标检测方法、装置、计算机设备及计算机可读存储介质。

技术介绍

1、在深度学习领域，由于标注数据的获取成本高昂和标注数据量不足等问题，为了充分利用已有的数据，半监督学习逐渐成为一种重要的解决方案。半监督学习是指在训练数据中，只有一小部分样本被标记，而大部分样本没有被标记。半监督学习旨在利用未标记样本的信息，提高模型的性能和泛化能力，并且半监督学习在图像分类、文本分类、目标检测等领域得到了广泛应用，并取得了较好的效果。

2、soft-teacher算法基于知识蒸馏的思想，使用一个教师网络和一个学生网络来共同学习有标签和无标签数据。学生网络是一个与教师网络结构相同但参数不同的目标检测器，用于在有标签数据上进行正常的监督学习，并在无标签数据上进行自训练。教师网络是一个由学生网络加权得到的目标检测器，用于在无标签数据上生成伪框和伪类别分数。

3、通过深入研究已有的soft-teacher框架，专利技术人发现其可能存在以下问题：如图1所示，强数据增强与弱数据增强的程度不适合，导致特征丢失，从而造成准确率的下降。

技术实现思路

1、针对上述技术问题，本申请提供一种半监督目标检测方法、装置、计算机设备及计算机可读存储介质，能够提升模型训练效果，提高检测结果的精度。

2、本申请提供一种半监督目标检测方法，包括：

3、步骤s1、获取有标签样本图像和无标签样本图像；

4、步骤s2、利用预设强数据增强方式和预设

5、步骤s3、构建半监督目标检测模型，目标检测模型包括基于目标检测网络的教师模型和学生模型；

6、步骤s4、基于有标签样本图像对学生模型进行训练，获得训练后的学生模型对有标签样本图像的预测损失；

7、步骤s5、将训练后的学生模型的参数以指数滑动平均的方式更新至教师模型；

8、步骤s6、根据训练后的学生模型对强数据增强后的无标签样本图像的输出以及教师模型对弱数据增强后的无标签样本图像的输出，计算回归损失和分类损失；

9、步骤s7、根据预测损失、回归损失和分类损失获取损失函数值，并判断损失函数值是否收敛在预设范围内，若是，则完成目标检测模型的训练，若否，则根据损失函数值修改学生模型的参数，并返回步骤s4；

10、步骤s8、将待测图像输入目标检测模型，得到待测图像的检测结果。

11、在一实施方式中，预设强数据增强方式包括：50％概率的随机翻转、2次随机色彩变化、2次随机几何变换、每张样本图像随机擦除0至20％；预设弱数据增强方式包括30％概率的随机翻转。

12、在一实施方式中，步骤s6，包括：

13、获取教师模型对弱数据增强后的无标签样本图像进行预测所输出的预测结果；

14、基于设定阈值对预测结果进行筛选，获得弱数据增强后的无标签样本图像的伪标签；

15、根据训练后的学生模型对强数据增强后的无标签样本图像进行预测所输出的标签以及弱数据增强后的无标签样本图像的伪标签，获取分类损失；

16、采用自适应抖动的门单元抖动算法对伪标签进行抖动，以获得伪标签对应的多个抖动框；

17、通过教师模型对各抖动框进行回归计算，获取回归损失。

18、在一实施方式中，根据训练后的学生模型对强数据增强后的无标签样本图像进行预测所输出的标签以及弱数据增强后的无标签样本图像的伪标签，获取分类损失，包括：

19、将弱数据增强后的无标签样本图像的伪标签转化为强数据增强后的无标签样本图像的伪标签；

20、根据训练后的学生模型对强数据增强后的无标签样本图像进行预测所输出的标签以及强数据增强后的无标签样本图像的伪标签，获取分类损失。

21、在一实施方式中，损失函数为l＝ls+λlu，ls表示预测损失，lu表示无标签样本图像损失，包括回归损失和分类损失nu为无标签样本图像的总数，为第i张无标签样本图像。

22、在一实施方式中，目标检测网络为fasterr-cnn，fasterr-cnn包括特征金字塔网络。

23、在一实施方式中，步骤s5，包括：

24、根据公式更新教师模型，其中，θi表示当前迭代次数i时教师模型的参数，表示当前迭代次数i时学生模型的参数，α为用于控制更新速度的超参数。

25、本申请还提供一种半监督目标检测装置，包括：

26、样本获取模块，用于获取有标签样本图像和无标签样本图像；

27、图像处理模块，用于利用预设强数据增强方式和预设弱数据增强方式分别对无标签样本图像进行处理，获得强数据增强后的无标签样本图像和弱数据增强后的无标签样本图像；

28、模型构建模块，用于构建半监督目标检测模型，目标检测模型包括基于目标检测网络的教师模型和学生模型；

29、训练模块，用于基于有标签样本图像对学生模型进行训练，获得训练后的学生模型对有标签样本图像的预测损失；

30、更新模块，用于将训练后的学生模型的参数以指数滑动平均的方式更新至教师模型；

31、计算模块，用于根据训练后的学生模型对强数据增强后的无标签样本图像的输出以及教师模型对弱数据增强后的无标签样本图像的输出，计算回归损失和分类损失；

32、判断模块，用于根据预测损失、回归损失和分类损失获取损失函数值，并判断损失函数值是否收敛在预设范围内，若是，则完成目标检测模型的训练，若否，则根据损失函数值修改学生模型的参数；

33、检测模块，用于将待测图像输入目标检测模型，得到待测图像的检测结果。

34、本申请还提供一种计算机设备，包括：存储器、处理器，其中，所述存储器上存储有用于在所述处理器上执行的计算机程序指令，所述处理器执行该计算机程序指令时，实现如上所述的半监督目标检测方法。

35、本申请还提供一种计算机可读存储介质，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时实现如上所述半监督目标检测方法的步骤。

36、如上所述，本申请的半监督目标检测方法，包括：步骤s1、获取有标签样本图像和无标签样本图像；步骤s2、利用预设强数据增强方式和预设弱数据增强方式分别对无标签样本图像进行处理，获得强数据增强后的无标签样本图像和弱数据增强后的无标签样本图像；步骤s3、构建半监督目标检测模型，目标检测模型包括基于目标检测网络的教师模型和学生模型；步骤s4、基于有标签样本图像对学生模型进行训练，获得训练后的学生模型对有标签样本图像的预测损失；步骤s5、将训练后的学生模型的参数以指数滑动平均的方式更新至教师模型；步骤s6、根据训练后的学生模型对强数据增强后的无标签样本图像的输出以及教师模型对弱数据增强后的无标签样本图像的输出，计算回归损失和分类损失；步骤s7、本文档来自技高网...

【技术保护点】

1.一种半监督目标检测方法，其特征在于，所述方法包括：

2.如权利要求1所述的方法，其特征在于，预设强数据增强方式包括：50％概率的随机翻转、2次随机色彩变化、2次随机几何变换、每张样本图像随机擦除0至20％；预设弱数据增强方式包括30％概率的随机翻转。

3.如权利要求1所述的方法，其特征在于，步骤S6，包括：

4.如权利要求4所述的方法，其特征在于，根据训练后的学生模型对强数据增强后的无标签样本图像进行预测所输出的标签以及弱数据增强后的无标签样本图像的伪标签，获取分类损失，包括：

5.如权利要求1至4中任一项所述的方法，其特征在于，损失函数为L＝LS+λLU，LS表示预测损失，LU表示无标签样本图像损失，包括回归损失和分类损失NU为无标签样本图像的总数，为第i张无标签样本图像。

6.如权利要求1所述的方法，其特征在于，目标检测网络为FasterR-CNN，FasterR-CNN包括特征金字塔网络。

7.如权利要求1所述的方法，其特征在于，步骤S5，包括：

8.一种半监督目标检测装置，其特征在于，包括：

9.一种计算机设备，其特征在于，包括处理器和存储器，所述存储器上存储有用于在所述处理器上执行的计算机程序指令，所述处理器执行该计算机程序指令时，实现如权利要求1-7中任意一项所述的半监督目标检测方法。

10.一种计算机可读存储介质，其特征在于，其存储有计算机指令，所述计算机指令由处理器运行时，实现如权利要求1-7中任意一项所述的半监督目标检测方法。

...

【技术特征摘要】

1.一种半监督目标检测方法，其特征在于，所述方法包括：

3.如权利要求1所述的方法，其特征在于，步骤s6，包括：

5.如权利要求1至4中任一项所述的方法，其特征在于，损失函数为l＝ls+λlu，ls表示预测损失，lu表示无标签样本图像损失，包括回归损失和分类损失nu...

【专利技术属性】
技术研发人员：于天剑，张庆东，向超群，成庶，伍珣，
申请(专利权)人：中南大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人