目标检测网络的训练及目标检测方法、装置及设备制造方法及图纸

技术编号:35215933 阅读:30 留言:0更新日期:2022-10-15 10:31
本公开提供了一种目标检测网络的训练及目标检测方法、装置及设备,该训练方法包括:获取已标注训练图像样本集和未标注训练图像样本集;分别将各已标注训练图像样本输入学生网络中进行训练,确定第一损失函数;分别将各未标注训练图像样本输入教师网络中,获得第一目标检测行为信息;根据各未标注训练图像样本和第一目标检测行为信息,训练所述学生网络,获得第二目标检测行为信息,确定第二损失函数,并根据所述第一损失函数和所述第二损失函数确定目标损失函数,在迭代训练次数达到阈值或者所述目标损失函数满足预设收敛条件的情况下,获得目标检测网络。获得目标检测网络。获得目标检测网络。

【技术实现步骤摘要】
目标检测网络的训练及目标检测方法、装置及设备


[0001]本公开涉及计算机
,具体而言,涉及一种目标检测网络的训练及目标检测方法、装置、设备及存储介质。

技术介绍

[0002]相关技术中,半监督目标检测算法,较常采用平均教师(Mean

Teacher)方法,教师网络(teacher model)由学生网络(student model)通过指数移动平均值(Exponential Moving Average,EMA)产生,该方法主要依赖于教师网络生成的伪标签(pseudo label),来指导学生网络的学习。对于目标检测任务,伪标签除了包含类别标签外,还包括表征目标位置的候选框,但是,教师网络生成的候选框噪声较大,定位不准确的候选框就会降低学生网络训练的准确性,从而导致最终训练的目标检测模型准确性较低,降低了目标检测的准确性。

技术实现思路

[0003]本公开实施例至少提供一种目标检测网络的训练及目标检测方法、装置、设备及存储介质。
[0004]第一方面,本公开实施例提供了一种目标检测网络的训练方法,该方法包括:
[0005]获取已标注训练图像样本集和未标注训练图像样本集;
[0006]分别将所述已标注训练图像样本集中各已标注训练图像样本输入学生网络中进行训练,确定第一损失函数,其中,所述第一损失函数为所述学生网络识别出的类别与已标注训练图像样本的已标注类别之间的损失函数;
[0007]分别将所述未标注训练图像样本集中各未标注训练图像样本输入教师网络中,获得对所述各未标注训练图像样本的第一目标检测行为信息;
[0008]根据所述各未标注训练图像样本和所述第一目标检测行为信息,训练所述学生网络,获得对所述各未标注训练图像样本的第二目标检测行为信息,确定第二损失函数,并根据所述第一损失函数和所述第二损失函数确定目标损失函数,在迭代训练次数达到阈值或者所述目标损失函数满足预设收敛条件的情况下,获得目标检测网络,其中,所述第二损失函数为所述第二目标检测行为信息与所述第一目标检测行为信息之间的损失函数。
[0009]本公开实施例中,采用已标注训练图像样本集和未标注训练图像样本集进行迭代训练,其中,针对未标注训练图像样本集,构建教师网络的第一目标检测行为信息和学生网络的第二目标检测行为信息之间的损失函数,能够充分利用教师网络产生的监督信息,提高目标检测网络的性能。
[0010]一种可选的实施方式中,在所述第一目标检测行为信息中识别出的多个第一候选框被聚类为多个簇情况下,则根据所述第一损失函数和所述第二损失函数确定目标损失函数,具体包括:
[0011]针对所述多个簇中的每个簇,得到所述簇对应的第二损失函数;
[0012]基于得到的多个第二损失函数的加权平均,得到第三损失函数;
[0013]根据所述第三损失函数和所述第一损失函数,得到所述目标损失函数。
[0014]本公开实施例中,针对聚类获得的多个簇,可以分别获得第二损失函数,并通过加权平均获得最终的目标损失函数,提高计算的效率和可靠性。
[0015]一种可选的实施方式中,针对所述多个簇中的每个簇,得到所述簇对应的第二损失函数,包括:
[0016]分别针对所述多个簇中每个簇,基于所述学生网络识别出目标的各第二候选框的类别,与所述教师网络识别出的置信度最高的第一候选框的类别之间的损失函数,获得类别损失函数;
[0017]基于所述学生网络识别出目标的各第二候选框,与所述教师网络识别出的置信度最高的第一候选框之间的损失函数,获得回归损失函数;
[0018]基于所述学生网络识别出目标的各第二候选框排序分布,与所述教师网络识别出的各第一候选框排序分布之间的损失函数,获得排序分布损失函数;
[0019]根据所述类别损失函数、所述回归损失函数和所述排序分布损失函数,确定所述第二损失函数。
[0020]本公开实施例中,针对各个簇,分别构建类别损失函数、回归损失函数和排序分布损失函数,进而来指导学生网络的训练,可以充分利用教师网络在目标检测过程中产生的监督信息,提高训练的性能。
[0021]一种可选的实施方式中,根据所述类别损失函数、所述回归损失函数和所述排序分布损失函数,确定所述第二损失函数,具体包括:
[0022]获得所述类别损失函数和所述回归损失函数之间的加和,并获得所述排序分布损失函数与第一权重值之间的乘积,将所述加和以及所述乘积相加,作为所述第二损失函数,其中,所述第一权重值用于控制排序分布所占损失权重。
[0023]本公开实施例中,通过权重值,可以控制不同信息的损失权重,进而控制学生网络的训练,获得符合所需的目标检测网络。
[0024]一种可选的实施方式中,在迭代训练次数达到阈值或者所述目标损失函数满足预设收敛条件的情况下,所述获得所述目标检测网络,包括:
[0025]针对当前次数的迭代训练,根据所述各已标注训练图像样本,以及根据所述各未标注训练图像样本和所述第一目标检测行为信息,训练所述学生网络,并根据所述当前次数迭代训练获得的学生网络的模型参数,确定下一次迭代训练的教师网络的模型参数,直至所述迭代训练次数达到阈值或所述目标损失函数收敛,获得所述目标检测网络。
[0026]本公开实施例中,每轮迭代训练,更新学生网络,并更新用于下一次迭代训练的教师网络,提高目标检测网络的可收敛性和准确性。
[0027]一种可选的实施方式中,所述获得所述目标检测网络,具体包括:
[0028]将所述迭代训练次数达到阈值或者所述目标损失函数收敛时迭代训练获得的所述教师网络或所述学生网络,作为所述目标检测网络。
[0029]第二方面,本公开实施例还提供一种目标检测方法,包括:
[0030]获取待检测图像;
[0031]利用上述第一方面中的目标检测网络的训练方法生成的目标检测网络,对所述待
检测图像进行目标检测,获得从所述待检测图像中检测到的目标的类别。
[0032]本公开实施例中,目标检测网络是采用教师网络对目标训练图像样本集中各目标训练图像样本的目标检测行为信息对学生网络进行迭代训练,以使针对同一目标训练图像样本,学生网络和教师网络的目标检测行为信息满足预设相似度条件,进而在进行目标检测时,获取待检测图像,并基于目标检测网络,对待检测图像进行目标检测,从而获得从待检测图像中检测到的目标的类别。这样,将教师网络在目标检测过程中的目标检测行为信息,来监督学生网络的训练,让学生网络模仿教师网络的目标检测行为信息来获得类别标签,可以挖掘和利用更加丰富的监督信息,提高了训练的准确性和可靠性,从而提高了目标检测的准确性。
[0033]一种可选的实施方式中,所述待检测图像为监控设备拍摄到的待检测监控图像,则获得从所述待检测图像中检测到的目标的类别,包括:
[0034]利用所述目标检测网络,对所述待检测监控图像中人体进行目标检测,确定所述待检测监控图像中是否存在人体本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种目标检测网络的训练方法,其特征在于,包括:获取已标注训练图像样本集和未标注训练图像样本集;分别将所述已标注训练图像样本集中各已标注训练图像样本输入学生网络中进行训练,确定第一损失函数,其中,所述第一损失函数为所述学生网络识别出的类别与已标注训练图像样本的已标注类别之间的损失函数;分别将所述未标注训练图像样本集中各未标注训练图像样本输入教师网络中,获得对所述各未标注训练图像样本的第一目标检测行为信息;根据所述各未标注训练图像样本和所述第一目标检测行为信息,训练所述学生网络,获得对所述各未标注训练图像样本的第二目标检测行为信息,确定第二损失函数,并根据所述第一损失函数和所述第二损失函数确定目标损失函数,在迭代训练次数达到阈值或者所述目标损失函数满足预设收敛条件的情况下,获得目标检测网络,其中,所述第二损失函数为所述第二目标检测行为信息与所述第一目标检测行为信息之间的损失函数。2.根据权利要求1所述的方法,其特征在于,在所述第一目标检测行为信息中识别出的多个第一候选框被聚类为多个簇情况下,则根据所述第一损失函数和所述第二损失函数确定目标损失函数,包括:针对所述多个簇中的每个簇,得到所述簇对应的第二损失函数;基于得到的多个第二损失函数的加权平均,得到第三损失函数;根据所述第三损失函数和所述第一损失函数,得到所述目标损失函数。3.根据权利要求2所述的方法,其特征在于,针对所述多个簇中的每个簇,得到所述簇对应的第二损失函数,包括:分别针对所述多个簇中每个簇,基于所述学生网络识别出目标的各第二候选框的类别,与所述教师网络识别出的置信度最高的第一候选框的类别之间的损失函数,获得类别损失函数;基于所述学生网络识别出目标的各第二候选框,与所述教师网络识别出的置信度最高的第一候选框之间的损失函数,获得回归损失函数;基于所述学生网络识别出目标的各第二候选框排序分布,与所述教师网络识别出的各第一候选框排序分布之间的损失函数,获得排序分布损失函数;根据所述类别损失函数、所述回归损失函数和所述排序分布损失函数,确定所述第二损失函数。4.根据权利要求3所述的方法,其特征在于,根据所述类别损失函数、所述回归损失函数和所述排序分布损失函数,确定所述第二损失函数,包括:获得所述类别损失函数和所述回归损失函数之间的加和,并获得所述排序分布损失函数与第一权重值之间的乘积,将所述加和以及所述乘积相加,作为所述第二损失函数,其中,所述第一权重值用于控制排序分布所占损失权重。5.根据权利要求1至4任一项所述的方法,其特征在于,在迭代训练次数达到阈值或者所述目标损失函数满足预设收敛条件的情况下,所述获得所述目标检测网络,包括:针对当前次数的迭代训练,根据所述各已标注训练图像样本,以及根据所述各未标注训练图像样本和所述第一目标检测行为信息,训练所述学生网络,并根据所述当前次数迭代训练获得的学生网络的模型参数,确定下一次迭代训练的教师网络的模型参数,直至所
述迭代训练次数达到阈值或所述目标损失函数收敛,获得所述目标检测网络。6.根据权利要求5所述的方法,其特征在于,所述获得所述目标检测...

【专利技术属性】
技术研发人员:李钢王宇杰
申请(专利权)人:上海商汤智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1