目标检测模型训练方法、装置、设备及可读存储介质制造方法及图纸

技术编号:35072987 阅读:33 留言:0更新日期:2022-09-28 11:36
本申请公开了一种目标检测模型训练方法、装置、设备及可读存储介质。该方案中,获取第一训练数据集和第二训练数据集和目标检测模型,第一训练数据集中的训练数据的标签为人工标注的标签,第二训练数据集中的训练数据是无标签数据;基于训练好的目标检测教师模型预测得到第二训练数据集中的训练数据的标签;利用第一训练数据集、第一训练数据集中的训练数据的标签、第二训练数据集以及所述第二训练数据集中的训练数据的标签对目标检测模型进行训练,得到训练好的目标检测模型。上述方案中,通过训练好的目标检测教师模型得到无标签数据的伪标签,实现利用无标签数据训练目标检测教师模型的目的,使得目标检测模型的训练无需依赖大量标注数据。大量标注数据。大量标注数据。

【技术实现步骤摘要】
目标检测模型训练方法、装置、设备及可读存储介质


[0001]本申请涉及机器视觉
,更具体的说,是涉及一种目标检测模型训练方法、装置、设备及可读存储介质。

技术介绍

[0002]随着深度学习和计算机视觉的快速发展,相关技术已经在诸多领域广泛应用。目标检测(Object Detection)作为图像理解中的重要一环,其任务是找出图像中所有感兴趣的目标(物体),确定它们的位置和大小,是机器视觉领域的核心问题之一。目标检测在很多领域都有应用需求,包括人脸检测、行人检测、车辆检测以及遥感影像中的重要地物检测等。
[0003]目前,目标检测模型的训练需要依赖大量标注数据,但是,在一些领域中需要对一些零散目标进行检测,比如,在智慧城市业务领域中需要对环保工人、医疗垃圾袋、手推垃圾车等零散目标进行检测,在这种场景下,获取大量标注数据往往十分困难,只能得到少量的标注数据。
[0004]因此,如何提供一种无需依赖大量标注数据的目标检测模型训练方法,成为本领域技术人员亟待解决的技术问题。

技术实现思路

[0005]鉴于上述问题,本申请提出了一种目标检测模型训练方法、装置、设备及可读存储介质。具体方案如下:
[0006]一种目标检测模型训练方法,所述方法包括:
[0007]获取第一训练数据集、第二训练数据集和目标检测模型,所述第一训练数据集中的训练数据的标签为人工标注的标签,所述标签包括目标框标签及目标类别标签;所述第二训练数据集中的训练数据是无标签数据;
[0008]基于训练好的目标检测教师模型预测得到所述第二训练数据集中的训练数据的标签;
[0009]利用所述第一训练数据集、所述第一训练数据集中的训练数据的标签、所述第二训练数据集以及所述第二训练数据集中的训练数据的标签对所述目标检测模型进行训练,得到训练好的目标检测模型。
[0010]可选地,所述目标检测模型包括主干网络、回归分支网络和分类分支网络,所述利用所述第一训练数据集、所述第一训练数据集中的训练数据的标签、所述第二训练数据集以及所述第二训练数据集中的训练数据的标签对所述目标检测模型进行训练,得到训练好的目标检测模型,包括:
[0011]利用所述第一训练数据集和所述第一训练数据集中的训练数据的标签,采用第一学习率对所述目标检测模型进行第一次训练,得到第一次训练后的目标检测模型;
[0012]将所述第一次训练后的目标检测模型的回归分支网络固定,利用所述第二训练数
据集和所述第二训练数据集中的训练数据的标签,采用第二学习率对所述第一次训练后的目标检测模型的主干网络和分类分支网络进行第二次训练,得到训练好的目标检测模型,所述第二学习率小于所述第一学习率。
[0013]可选地,所述利用所述第一训练数据集和所述第一训练数据集中的训练数据的标签,采用第一学习率对所述目标检测模型进行第一次训练,得到第一次训练后的目标检测模型,包括:
[0014]以所述第一训练数据集中各训练数据为训练样本,以所述分类分支的输出趋近于所述第一训练数据集中各训练数据的目标类别标签,且所述回归分支的输出趋近于所述第一训练数据集中各训练数据的目标框标签为训练目标,采用第一学习率对所述目标检测模型进行第一次训练,得到第一次训练后的目标检测模型。
[0015]可选地,所述将所述第一次训练后的目标检测模型的回归分支网络固定,利用所述第二训练数据集和所述第二训练数据集中的训练数据的标签,采用第二学习率对所述第一次训练后的目标检测模型的主干网络和分类分支网络进行第二次训练,得到训练好的目标检测模型,包括:
[0016]对所述第二训练数据集中各训练数据的目标类别标签进行标签平滑处理,得到所述第二训练数据集中各训练数据的经过标签平滑处理后的目标类别标签;
[0017]将所述第一次训练后的目标检测模型的回归分支网络固定,利用所述第二训练数据集、所述第二训练数据集中的训练数据的经过平滑处理后的目标类别标签和所述第二训练数据集中的训练数据的目标框标签,采用第二学习率对所述第一次训练后的目标检测模型的主干网络和分类分支网络进行第二次训练,得到训练好的目标检测模型。
[0018]可选地,所述将所述第一次训练后的目标检测模型的回归分支网络固定,利用所述第二训练数据集、所述第二训练数据集中的训练数据的经过平滑处理后的目标类别标签和所述第二训练数据集中的训练数据的目标框标签,采用第二学习率对所述第一次训练后的目标检测模型的主干网络和分类分支网络进行第二次训练,得到训练好的目标检测模型,包括:
[0019]对所述第二训练数据集中各训练数据进行增强处理,得到所述第二训练数据集中各训练数据对应的增强数据;
[0020]以所述第二训练数据集中各训练数据对应的增强数据为训练样本,以所述第一次训练后的目标检测模型分类分支网络的输出趋近于所述第二训练数据集中各训练数据的经过标签平滑处理后的目标类别标签,且,所述第一次训练后的目标检测模型回归分支网络的输出趋近于所述第二训练数据集中各训练数据的目标框标签为训练目标,采用第二学习率对所述第一次训练后的目标检测模型的主干网络和分类分支网络进行第二次训练,得到训练好的目标检测模型。
[0021]可选地,所述目标检测教师模型的训练方式如下:
[0022]获取目标检测教师模型,所述目标检测教师模型与所述目标检测模型的结构相同;
[0023]利用所述第一训练数据集对所述目标检测教师模型进行训练,得到训练好的目标检测教师模型。
[0024]可选地,所述利用所述第一训练数据集对所述目标检测教师模型进行训练,得到
训练好的目标检测教师模型,包括:
[0025]以所述第一训练数据集中各训练数据为训练样本,以所述分类分支的输出趋近于所述第一训练数据集中各训练数据的目标类别,且所述回归分支的输出趋近于所述第一训练数据集中各训练数据的目标框为训练目标,对所述目标检测教师模型进行训练,得到训练好的目标检测教师模型。
[0026]一种目标检测模型训练装置,所述装置包括:
[0027]获取单元,用于获取第一训练数据集、第二训练数据集和目标检测模型,所述第一训练数据集中的训练数据的标签为人工标注的标签,所述标签包括目标框标签及目标类别标签;所述第二训练数据集中的训练数据是无标签数据;
[0028]标签预测单元,用于基于训练好的目标检测教师模型预测得到所述第二训练数据集中的训练数据的标签;
[0029]训练单元,用于利用所述第一训练数据集、所述第一训练数据集中的训练数据的标签、所述第二训练数据集以及所述第二训练数据集中的训练数据的标签对所述目标检测模型进行训练,得到训练好的目标检测模型。
[0030]可选地,所述目标检测模型包括主干网络、回归分支网络和分类分支网络,所述训练单元,包括:
[0031]第一训练单元,用于利用所述第一训练数据集和所述第一训练数据集中的训练数据的标签,采用第一学习率对所述目标检测模型进行第一次训练,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种目标检测模型训练方法,其特征在于,所述方法包括:获取第一训练数据集、第二训练数据集和目标检测模型,所述第一训练数据集中的训练数据的标签为人工标注的标签,所述标签包括目标框标签及目标类别标签;所述第二训练数据集中的训练数据是无标签数据;基于训练好的目标检测教师模型预测得到所述第二训练数据集中的训练数据的标签;利用所述第一训练数据集、所述第一训练数据集中的训练数据的标签、所述第二训练数据集以及所述第二训练数据集中的训练数据的标签对所述目标检测模型进行训练,得到训练好的目标检测模型。2.根据权利要求1所述的方法,其特征在于,所述目标检测模型包括主干网络、回归分支网络和分类分支网络,所述利用所述第一训练数据集、所述第一训练数据集中的训练数据的标签、所述第二训练数据集以及所述第二训练数据集中的训练数据的标签对所述目标检测模型进行训练,得到训练好的目标检测模型,包括:利用所述第一训练数据集和所述第一训练数据集中的训练数据的标签,采用第一学习率对所述目标检测模型进行第一次训练,得到第一次训练后的目标检测模型;将所述第一次训练后的目标检测模型的回归分支网络固定,利用所述第二训练数据集和所述第二训练数据集中的训练数据的标签,采用第二学习率对所述第一次训练后的目标检测模型的主干网络和分类分支网络进行第二次训练,得到训练好的目标检测模型,所述第二学习率小于所述第一学习率。3.根据权利要求2所述的方法,其特征在于,所述利用所述第一训练数据集和所述第一训练数据集中的训练数据的标签,采用第一学习率对所述目标检测模型进行第一次训练,得到第一次训练后的目标检测模型,包括:以所述第一训练数据集中各训练数据为训练样本,以所述分类分支的输出趋近于所述第一训练数据集中各训练数据的目标类别标签,且所述回归分支的输出趋近于所述第一训练数据集中各训练数据的目标框标签为训练目标,采用第一学习率对所述目标检测模型进行第一次训练,得到第一次训练后的目标检测模型。4.根据权利要求3所述的方法,其特征在于,所述将所述第一次训练后的目标检测模型的回归分支网络固定,利用所述第二训练数据集和所述第二训练数据集中的训练数据的标签,采用第二学习率对所述第一次训练后的目标检测模型的主干网络和分类分支网络进行第二次训练,得到训练好的目标检测模型,包括:对所述第二训练数据集中各训练数据的目标类别标签进行标签平滑处理,得到所述第二训练数据集中各训练数据的经过标签平滑处理后的目标类别标签;将所述第一次训练后的目标检测模型的回归分支网络固定,利用所述第二训练数据集、所述第二训练数据集中的训练数据的经过平滑处理后的目标类别标签和所述第二训练数据集中的训练数据的目标框标签,采用第二学习率对所述第一次训练后的目标检测模型的主干网络和分类分支网络进行第二次训练,得到训练好的目标检测模型。5.根据...

【专利技术属性】
技术研发人员:贾若然张友国谭昶刘江冯祥韩辉李亚玲张慧萍宋薇薇
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1