目标检测网络的训练及目标检测方法、装置及设备制造方法及图纸

技术编号：35215933 阅读：30 留言：0更新日期：2022-10-15 10:31

本公开提供了一种目标检测网络的训练及目标检测方法、装置及设备，该训练方法包括：获取已标注训练图像样本集和未标注训练图像样本集；分别将各已标注训练图像样本输入学生网络中进行训练，确定第一损失函数；分别将各未标注训练图像样本输入教师网络中，获得第一目标检测行为信息；根据各未标注训练图像样本和第一目标检测行为信息，训练所述学生网络，获得第二目标检测行为信息，确定第二损失函数，并根据所述第一损失函数和所述第二损失函数确定目标损失函数，在迭代训练次数达到阈值或者所述目标损失函数满足预设收敛条件的情况下，获得目标检测网络。获得目标检测网络。获得目标检测网络。

全部详细技术资料下载

【技术实现步骤摘要】
目标检测网络的训练及目标检测方法、装置及设备

[0001]本公开涉及计算机
，具体而言，涉及一种目标检测网络的训练及目标检测方法、装置、设备及存储介质。

技术介绍

[0002]相关技术中，半监督目标检测算法，较常采用平均教师(Mean
‑
Teacher)方法，教师网络(teacher model)由学生网络(student model)通过指数移动平均值(Exponential Moving Average，EMA)产生，该方法主要依赖于教师网络生成的伪标签(pseudo label)，来指导学生网络的学习。对于目标检测任务，伪标签除了包含类别标签外，还包括表征目标位置的候选框，但是，教师网络生成的候选框噪声较大，定位不准确的候选框就会降低学生网络训练的准确性，从而导致最终训练的目标检测模型准确性较低，降低了目标检测的准确性。

技术实现思路

[0003]本公开实施例至少提供一种目标检测网络的训练及目标检测方法、装置、设备及存储介质。
[0004]第一方面，本公开实施例提供了一种目标检测网络的训练方法，该方法包括：
[0005]获取已标注训练图像样本集和未标注训练图像样本集；
[0006]分别将所述已标注训练图像样本集中各已标注训练图像样本输入学生网络中进行训练，确定第一损失函数，其中，所述第一损失函数为所述学生网络识别出的类别与已标注训练图像样本的已标注类别之间的损失函数；
[0007]分别将所述未标注训练图像样本集中各未标注训练图像样本输入教师...

【技术保护点】

【技术特征摘要】
1.一种目标检测网络的训练方法，其特征在于，包括：获取已标注训练图像样本集和未标注训练图像样本集；分别将所述已标注训练图像样本集中各已标注训练图像样本输入学生网络中进行训练，确定第一损失函数，其中，所述第一损失函数为所述学生网络识别出的类别与已标注训练图像样本的已标注类别之间的损失函数；分别将所述未标注训练图像样本集中各未标注训练图像样本输入教师网络中，获得对所述各未标注训练图像样本的第一目标检测行为信息；根据所述各未标注训练图像样本和所述第一目标检测行为信息，训练所述学生网络，获得对所述各未标注训练图像样本的第二目标检测行为信息，确定第二损失函数，并根据所述第一损失函数和所述第二损失函数确定目标损失函数，在迭代训练次数达到阈值或者所述目标损失函数满足预设收敛条件的情况下，获得目标检测网络，其中，所述第二损失函数为所述第二目标检测行为信息与所述第一目标检测行为信息之间的损失函数。2.根据权利要求1所述的方法，其特征在于，在所述第一目标检测行为信息中识别出的多个第一候选框被聚类为多个簇情况下，则根据所述第一损失函数和所述第二损失函数确定目标损失函数，包括：针对所述多个簇中的每个簇，得到所述簇对应的第二损失函数；基于得到的多个第二损失函数的加权平均，得到第三损失函数；根据所述第三损失函数和所述第一损失函数，得到所述目标损失函数。3.根据权利要求2所述的方法，其特征在于，针对所述多个簇中的每个簇，得到所述簇对应的第二损失函数，包括：分别针对所述多个簇中每个簇，基于所述学生网络识别出目标的各第二候选框的类别，与所述教师网络识别出的置信度最高的第一候选框的类别之间的损失函数，获得类别损失函数；基于所述学生网络识别出目标的各第二候选框，与所述教师网络识别出的置信度最高的第一候选框之间的损失函数，获得回归损失函数；基于所述学生网络识别出目标的各第二候选框排序分布，与所述教师网络识别出的各第一候选框排序分布之间的损失函数，获得排序分布损失函数；根据所述类别损失函数、所述回归损失函数和所述排序分布损失函数，确定所述第二损失函数。4.根据权利要求3所述的方法，其特征在于，根据所述类别损失函数、所述回归损失函数和所述排序分布损失函数，确定所述第二损失函数，包括：获得所述类别损失函数和所述回归损失函数之间的加和，并获得所述排序分布损失函数与第一权重值之间的乘积，将所述加和以及所述乘积相加，作为所述第二损失函数，其中，所述第一权重值用于控制排序分布所占损失权重。5.根据权利要求1至4任一项所述的方法，其特征在于，在迭代训练次数达到阈值或者所述目标损失函数满足预设收敛条件的情况下，所述获得所述目标检测网络，包括：针对当前次数的迭代训练，根据所述各已标注训练图像样本，以及根据所述各未标注训练图像样本和所述第一目标检测行为信息，训练所述学生网络，并根据所述当前次数迭代训练获得的学生网络的模型参数，确定下一次迭代训练的教师网络的模型参数，直至所
述迭代训练次数达到阈值或所述目标损失函数收敛，获得所述目标检测网络。6.根据权利要求5所述的方法，其特征在于，所述获得所述目标检测...

【专利技术属性】
技术研发人员：李钢，王宇杰，
申请(专利权)人：上海商汤智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人