目标检测模型训练方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:39405240 阅读:10 留言:0更新日期:2023-11-19 15:57
本申请涉及一种目标检测模型训练方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:获取根据第一场景下的第一样本图像得到的第一目标检测模型;第一样本图像为携带标签的样本图像;获取第二场景下的第二初始样本图像;第二初始样本图像为不携带标签的样本图像;基于第一目标检测模型,对第二初始样本图像进行标签预测处理,得到携带预测标签的第二目标样本图像;根据携带预测标签的第二目标样本图像和第一目标检测模型,得到第二场景对应的目标检测教师模型;基于目标检测教师模型,对第二场景对应的目标检测学生模型进行知识蒸馏,得到第二场景下的第二目标检测模型。采用本方法,能够提高目标检测模型的泛化能力。力。力。

【技术实现步骤摘要】
目标检测模型训练方法、装置、计算机设备和存储介质


[0001]本申请涉及目标检测
,特别是涉及一种目标检测模型训练方法

装置

计算机设备

存储介质和计算机程序产品


技术介绍

[0002]目标检测作为计算机视觉领域的核心问题之一,已被广泛应用在各种场景中,例如工业生产领域

交通领域

医疗领域等

[0003]相关技术中,某一场景下的目标检测模型通常是基于该场景下的样本图像训练得到的;因此,当外界环境发生较大变化,例如目标检测模型部署在不同的场景下时,由于训练得到该目标检测模型的场景与部署该目标检测模型的场景之间存在差异,从而会导致该目标检测模型的性能下降

因此,基于相关技术训练得到的目标检测模型的泛化能力较弱


技术实现思路

[0004]基于此,有必要针对上述目标检模型泛化能力较弱的技术问题,提供一种能够提高目标检测模型的泛化能力的目标检测模型训练方法

装置

计算机设备

计算机可读存储介质和计算机程序产品

[0005]第一方面,本申请提供了一种目标检测模型训练方法

所述方法包括:
[0006]获取根据第一场景下的第一样本图像得到的第一目标检测模型;所述第一样本图像为携带标签的样本图像;
[0007]获取第二场景下的第二初始样本图像;所述第二场景为与所述第一场景不同的场景;所述第二初始样本图像为不携带标签的样本图像;
[0008]基于所述第一目标检测模型,对所述第二初始样本图像进行标签预测处理,得到携带预测标签的第二目标样本图像;
[0009]根据所述携带预测标签的第二目标样本图像和所述第一目标检测模型,得到所述第二场景对应的目标检测教师模型;
[0010]基于所述目标检测教师模型,对所述第二场景对应的目标检测学生模型进行知识蒸馏,得到所述第二场景下的第二目标检测模型

[0011]在其中一个实施例中,所述基于所述第一目标检测模型,对所述第二初始样本图像进行标签预测处理,得到携带预测标签的第二目标样本图像,包括:
[0012]基于所述第一目标检测模型,确定各个第二初始样本图像的预测标签;
[0013]从所述各个第二初始样本图像中,识别出对应的预测标签的置信度大于或者等于预设置信度阈值的第二初始样本图像,作为携带预测标签的第二目标样本图像

[0014]在其中一个实施例中,所述根据所述携带预测标签的第二目标样本图像和所述第一目标检测模型,得到所述第二场景对应的目标检测教师模型,包括:
[0015]基于所述携带预测标签的第二目标样本图像,对所述第一目标检测模型进行训练,得到训练后的第一目标检测模型;
[0016]将所述各个第二初始样本图像中,对应的预测标签的置信度小于所述预设置信度阈值的第二初始样本图像,作为所述第二初始样本图像,并将所述训练后的第一目标检测模型作为所述第一目标检测模型,返回基于所述第一目标检测模型,确定各个第二初始样本图像的预测标签的步骤,直到所述训练后的第一目标检测模型满足预设训练条件;
[0017]将满足所述预设训练条件的训练后的第一目标检测模型,确定为所述第二场景对应的目标检测教师模型

[0018]在其中一个实施例中,所述基于所述目标检测教师模型,对所述第二场景对应的目标检测学生模型进行知识蒸馏,得到所述第二场景下的第二目标检测模型,包括:
[0019]基于所述目标检测教师模型对所述第二目标样本图像进行目标检测,得到所述第二目标样本图像的教师标签,以及基于所述目标检测学生模型对所述第二目标样本图像进行目标检测,得到所述第二目标样本图像的学生标签;
[0020]基于所述第二目标样本图像的教师标签与学生标签之间的第一标签差异信息,以及所述第二目标样本图像的学生标签与预测标签之间的第二标签差异信息,对所述目标检测学生模型进行训练,得到所述第二场景下的第二目标检测模型

[0021]在其中一个实施例中,所述基于所述目标检测教师模型,对所述第二场景对应的目标检测学生模型进行知识蒸馏,得到所述第二场景下的第二目标检测模型,还包括:
[0022]确定所述第二目标样本图像对应于所述目标检测教师模型的中间网络层的教师输出特征,以及确定所述第二目标样本图像对应于所述目标检测学生模型的中间网络层的学生输出特征;
[0023]基于所述教师输出特征与所述学生输出特征之间的特征差异信息,对所述目标检测学生模型的中间网络层进行训练,得到所述第二场景下的第二目标检测模型

[0024]在其中一个实施例中,所述基于所述目标检测教师模型,对所述第二场景对应的目标检测学生模型进行知识蒸馏,得到所述第二场景下的第二目标检测模型,还包括:
[0025]基于所述目标检测教师模型得到各个第二目标样本图像的教师标签,以及基于所述目标检测学生模型得到各个第二目标样本图像的学生标签;
[0026]对各个教师标签之间的关系进行特征提取,得到教师标签关系信息,以及对各个学生标签之间的关系进行特征提取,得到学生标签关系信息;
[0027]基于所述教师标签关系信息与所述学生标签关系信息之间的关系差异信息,对所述目标检测学生模型进行训练,得到所述第二场景下的第二目标检测模型

[0028]第二方面,本申请还提供了一种目标检测模型训练装置

所述装置包括:
[0029]第一模型训练模块,用于获取根据第一场景下的第一样本图像得到的第一目标检测模型;所述第一样本图像为携带标签的样本图像;
[0030]样本图像获取模块,用于获取第二场景下的第二初始样本图像;所述第二场景为与所述第一场景不同的场景;所述第二初始样本图像为不携带标签的样本图像;
[0031]样本标签预测模块,用于基于所述第一目标检测模型,对所述第二初始样本图像进行标签预测处理,得到携带预测标签的第二目标样本图像;
[0032]检测模型迁移模块,用于根据所述携带预测标签的第二目标样本图像和所述第一目标检测模型,得到所述第二场景对应的目标检测教师模型;
[0033]第二模型训练模块,用于基于所述目标检测教师模型,对所述第二场景对应的目
标检测学生模型进行知识蒸馏,得到所述第二场景下的第二目标检测模型

[0034]第三方面,本申请还提供了一种计算机设备

所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
[0035]获取根据第一场景下的第一样本图像得到的第一目标检测模型;所述第一样本图像为携带标签的样本图像;
[0036]获取第二场景下的第二初始样本图本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种目标检测模型训练方法,其特征在于,所述方法包括:获取根据第一场景下的第一样本图像得到的第一目标检测模型;所述第一样本图像为携带标签的样本图像;获取第二场景下的第二初始样本图像;所述第二场景为与所述第一场景不同的场景;所述第二初始样本图像为不携带标签的样本图像;基于所述第一目标检测模型,对所述第二初始样本图像进行标签预测处理,得到携带预测标签的第二目标样本图像;根据所述携带预测标签的第二目标样本图像和所述第一目标检测模型,得到所述第二场景对应的目标检测教师模型;基于所述目标检测教师模型,对所述第二场景对应的目标检测学生模型进行知识蒸馏,得到所述第二场景下的第二目标检测模型
。2.
根据权利要求1所述的方法,其特征在于,所述基于所述第一目标检测模型,对所述第二初始样本图像进行标签预测处理,得到携带预测标签的第二目标样本图像,包括:基于所述第一目标检测模型,确定各个第二初始样本图像的预测标签;从所述各个第二初始样本图像中,识别出对应的预测标签的置信度大于或者等于预设置信度阈值的第二初始样本图像,作为携带预测标签的第二目标样本图像
。3.
根据权利要求2所述的方法,其特征在于,所述根据所述携带预测标签的第二目标样本图像和所述第一目标检测模型,得到所述第二场景对应的目标检测教师模型,包括:基于所述携带预测标签的第二目标样本图像,对所述第一目标检测模型进行训练,得到训练后的第一目标检测模型;将所述各个第二初始样本图像中,对应的预测标签的置信度小于所述预设置信度阈值的第二初始样本图像,作为所述第二初始样本图像,并将所述训练后的第一目标检测模型作为所述第一目标检测模型,返回基于所述第一目标检测模型,确定各个第二初始样本图像的预测标签的步骤,直到所述训练后的第一目标检测模型满足预设训练条件;将满足所述预设训练条件的训练后的第一目标检测模型,确定为所述第二场景对应的目标检测教师模型
。4.
根据权利要求1所述的方法,其特征在于,所述基于所述目标检测教师模型,对所述第二场景对应的目标检测学生模型进行知识蒸馏,得到所述第二场景下的第二目标检测模型,包括:基于所述目标检测教师模型对所述第二目标样本图像进行目标检测,得到所述第二目标样本图像的教师标签,以及基于所述目标检测学生模型对所述第二目标样本图像进行目标检测,得到所述第二目标样本图像的学生标签;基于所述第二目标样本图像的教师标签与学生标签之间的第一标签差异信息,以及所述第二目标样本图像的学生标签与预测标签之间的第二标签差异信息,对所述目标检测学生模型进行训练,得到所述第二场景下的第二目标检测模型
。5.
根据权利要求1...

【专利技术属性】
技术研发人员:赵紫州秦诗玮黄迎李翰良褚英昊吕君钰孔祥义王兴照
申请(专利权)人:深圳市微埃智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1