一种目标检测模型训练方法、装置以及电子设备制造方法及图纸

技术编号：41327363 阅读：2 留言：0更新日期：2024-05-13 15:05

一种目标检测模型训练方法、装置以及电子设备，该方法包括：利用有标签数据集对目标检测模型进行预训练；对无标签数据集进行第一预处理和第二预处理，分别得到第一批数据集和第二批数据集，将第一批数据集输入至第一检测网络，生成无标签数据集的伪标签；将伪标签、第二批数据集及有标签数据集输入至第二检测网络进行迭代训练；迭代训练以后，计算第二检测网络的网络参数以及输出检测结果，第一检测网络的网络参数根据第二检测网络的网络参数进行调整；重复上述步骤，直至第二检测网络的检测结果满足预设条件，结束训练。本申请的方法，不仅能够增加合成孔径雷达图像训练样本的多样性，还能提高目标检测模型的检测性能。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及计算机视觉，尤其涉及一种目标检测模型训练方法、装置以及电子设备。

技术介绍

1、近年来，由于数据规模和计算能力的增加，基于深度学习的方法，特别是基于卷积神经网络(cnn)的方法，在计算机视觉和自然语言处理方面表现出了优异的性能。类似地，基于cnn的方法由于其强大的特征提取能力，也适用于合成孔径雷达图像(sar)的目标检测。

2、但是现有的方法，大多依赖于全监督学习，这就需要大规模的标记训练样本。然而，尽管有大量的sar图像，但在现实中有标记的sar图像却很少。标注sar图像需要大量有经验的人力和资源，缺少标记的训练数据会降低检测性能。而半监督的方法，在再训练阶段以固定比率处理真实标签和伪标签的损失函数，可能导致预测结果恶化；而且，预测标记框的质量也会影响训练质量。

3、因此，如何增加合成孔径雷达图像训练样本的多样性，提高目标检测模型的检测性能，是目前研究的重要问题。

技术实现思路

1、本专利技术主要解决的技术问题是提供一种目标检测模型训练方法、装置以及电子设备，解决如何增加合成孔径雷达图像训练样本的多样性，提高目标检测模型检测性能的问题。

2、为解决上述技术问题，本专利技术采用的一个技术方案是提供一种目标检测模型训练方法，包括：

3、步骤一，利用有标签数据集对目标检测模型进行预训练。

4、步骤二，对无标签数据集进行第一预处理得到第一批数据集，将第一批数据集输入至目标检测模型的第一检测网络，生成无标签数据集的数据集。

5、步骤三，对无标签数据集进行第二预处理得到第二批数据集，将伪标签、第二批数据集及有标签数据集输入至目标检测模型的第二检测网络，对第二检测网络进行迭代训练。

6、步骤四，迭代训练以后，计算第二检测网络的网络参数以及输出检测结果，第一检测网络的网络参数根据第二检测网络的网络参数进行调整。

7、步骤五，重复步骤三和步骤四，直至第二检测网络的检测结果满足预设条件时，结束训练。

8、在一些实施例中，在步骤二中，对无标签数据集进行第一预处理，包括对无标签数据集中的图像进行水平翻转。

9、在一些实施例中，在步骤三中，对无标签数据集进行第二预处理，包括将无标签数据集中图像的所有像素与预设区域值内的随机值相乘。

10、在一些实施例中，在步骤三中，对无标签数据集进行第二预处理，还包括以给定概率将无标签数据集中图像的像素随机设置为0或255。

11、在一些实施例中，在步骤三中，还包括计算第二检测网络的总目标损失函数值l，计算方法为：l＝ll+αlu，其中，ll表示有标签数据集产生的损失值，lu表示无标签数据集产生的损失值，α表示控制权重。

12、有标签数据集产生的损失值ll，计算方法为：

13、

14、其中，nl表示有标签数据集中图像的总数，lcls表示分类损失，lreg表示标记框回归损失，和分别表示有标签数据集中的图像和该图像对应的标签。

15、无标签数据集产生的损失值lu，计算方法为：

16、

17、其中，nu表示无标签数据集中图像的总数，表示无标签数据集的分类损失的权重，表示无标签数据集的标记框回归损失的权重，和分别表示无标签数据集中的图像和该图像对应的标签。

18、在一些实施例中，控制权重α的计算方法为：

19、

20、其中，t表示时间，α1表示初始权重值，t0表示训练的总时间。

21、在一些实施例中，在步骤四中，在第二检测网络的输出端还加入了标记框可信度预测子网络，用于加权标记框的回归损失。

22、在一些实施例中，在步骤四中，第一检测网络的网络参数θtt根据第二检测网络的网络参数θst进行调整，方法为：

23、θtt＝δ·θtt-1+(1-δ)·θst，

24、其中，θst表示t时刻第二检测网络的网络参数，θtt表示t时刻的第一检测网络的网络参数，δ表示t-1时刻第一检测网络的系数。

25、为了解决上述技术问题，本申请还提供了一种目标检测模型训练装置，包括：

26、预处理单元，包括第一预处理模块和第二预处理模块，用于对无标签数据集进行预处理，分别得到第一批数据集和第二批数据集。

27、第一检测单元，包括第一检测网络，第一检测网络接收第一批数据集，并根据第一批数据集产生无标签数据集的伪标签。

28、第二检测单元，包括第二检测网络，第二检测网络接收第二批数据集、伪标签以及用于对目标检测模型进行预训练的有标签数据集，并进行迭代训练。

29、参数计算单元，用于计算第二检测网络迭代的网络参数，第二检测网络的网络参数用于调整第一检测网络的网络参数。

30、为了解决上述技术问题，本申请还提供了一种电子设备，包括相互耦接的存储器和处理器，处理器用于执行存储器中存储的程序指令，以实现上述的目标检测模型训练方法。

31、有益效果：本申请公开了一种目标检测模型训练方法、装置以及电子设备，该方法包括：步骤一，利用有标签数据集对目标检测模型进行预训练；步骤二，对无标签数据集进行第一预处理得到第一批数据集，将第一批数据集输入至目标检测模型的第一检测网络，生成无标签数据集的伪标签；步骤三，对无标签数据集进行第二预处理得到第二批数据集，将伪标签、第二批数据集及有标签数据集输入至目标检测模型的第二检测网络，对第二检测网络进行迭代训练；步骤四，迭代训练以后，计算第二检测网络的网络参数以及输出检测结果，第一检测网络的网络参数根据第二检测网络的网络参数进行调整；步骤五，重复步骤三和步骤四，直至第二检测网络的检测结果满足预设条件时，结束训练。本申请的方法，不仅能够增加合成孔径雷达图像训练样本的多样性，还能提高目标检测模型的检测性能。

本文档来自技高网...

【技术保护点】

1.一种目标检测模型训练方法，其特征在于，包括：

2.根据权利要求1所述的目标检测模型训练方法，其特征在于，在所述步骤二中，对所述无标签数据集进行第一预处理，包括对所述无标签数据集中的图像进行水平翻转。

3.根据权利要求1所述的目标检测模型训练方法，其特征在于，在所述步骤三中，对所述无标签数据集进行第二预处理，包括将所述无标签数据集中图像的所有像素与预设区域值内的随机值相乘。

4.根据权利要求3所述的目标检测模型训练方法，其特征在于，在所述步骤三中，对所述无标签数据集进行第二预处理，还包括以给定概率将所述无标签数据集中图像的像素随机设置为0或255。

5.根据权利要求1所述的目标检测模型训练方法，其特征在于，在所述步骤三中，还包括计算所述第二检测网络的总目标损失函数值L，计算方法为：L＝Ll+αLu，其中，Ll表示所述有标签数据集产生的损失值，Lu表示所述无标签数据集产生的损失值，α表示控制权重；

6.根据权利要求5所述的目标检测模型训练方法，其特征在于，所述控制权重α的计算方法为：

7.根据权利要求6所述的

8.根据权利要求1所述的目标检测模型训练方法，其特征在于，在所述步骤四中，所述第一检测网络的网络参数θTt根据所述第二检测网络的网络参数θSt进行调整，方法为：

9.一种目标检测模型训练装置，其特征在于，包括：

10.一种电子设备，其特征在于，包括相互耦接的存储器和处理器，所述处理器用于执行所述存储器中存储的程序指令，以实现权利要求1至8任一项所述的目标检测模型训练方法。

...

【技术特征摘要】

1.一种目标检测模型训练方法，其特征在于，包括：

5.根据权利要求1所述的目标检测模型训练方法，其特征在于，在所述步骤三中，还包括计算所述第二检测网络的总目标损失函数值l，计算方法为：l＝ll+αlu，其中...

【专利技术属性】
技术研发人员：田壮壮，王坤，刘洪昌，张恒伟，靳浩，陈帅，吴逢川，熊正大，彭锦超，贺会洲，沈义龙，刘胜利，陆洪涛，陆静，许增增，
申请(专利权)人：中国人民解放军六三八九一部队，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人