System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于软标签生成的目标检测模型的训练方法和装置制造方法及图纸_技高网

基于软标签生成的目标检测模型的训练方法和装置制造方法及图纸

技术编号:41010950 阅读:2 留言:0更新日期:2024-04-18 21:47
本公开涉及目标检测技术领域,提供了一种基于软标签生成的目标检测模型的训练方法和装置。该方法包括:将训练图像输入至目标检测教师模型,得到训练对象的第一检测结果;将训练图像输入至目标检测学生模型,得到训练对象的第二检测结果;基于第一检测结果以及第二检测结果进行软标签生成处理,得到训练对象的软标签;根据训练对象的软标签以及训练对象的标签再结合训练对象的第二检测结果确定目标损失值,并根据目标损失值更新目标检测学生模型的参数得到训练完成的目标检测学生模型。解决现有技术中目标检测教师模型的错误输出影响目标检测学生模型的性能的问题,提高了目标检测学生模型的性能。

【技术实现步骤摘要】

本公开涉及目标检测,尤其涉及一种基于软标签生成的目标检测模型的训练方法和装置


技术介绍

1、随着深度学习技术的迅速发展,目标检测模型逐渐被应用于生活中的多个方面。知识蒸馏的训练方法可以使轻量级的学生模型获得更为繁琐的教师模型中的知识。知识蒸馏使用一种教师模型-学生模型的训练结构,训练好的目标检测教师模型提供知识,目标检测学生模型通过蒸馏训练来获取目标检测教师模型的知识,使用目标检测教师模型的输出作为软标签,用数据的真实标签作为硬标签,两者联合起来去训练目标检测学生模型。训练得到的目标检测学生模型不仅能够正确分类,还需要准确地定位目标物体。但训练得到的目标检测教师模型也可能存在误差,这些误差可能影响训练目标检测学生模型,从而影响目标检测学生模型的性能。


技术实现思路

1、有鉴于此,本公开实施例提供了一种基于软标签生成的目标检测模型的训练方法、装置、电子设备及可读存储介质,以解决现有技术中目标检测教师模型的错误输出影响目标检测学生模型的性能的问题。

2、本公开实施例的第一方面,提供了一种基于软标签生成的目标检测模型的训练方法,包括:获取目标检测训练集,目标检测训练集包括多张训练图像和多张训练图像的标签,标签包括类别标签和检测框标签,类别标签用于表示对应训练图像上的训练对象的真实类别,检测框标签用于表示对应训练图像上的训练对象在训练图像上的位置的真实检测框;利用目标检测训练集对目标检测教师模型进行训练,得到训练完成的目标检测教师模型;将各个训练图像输入至目标检测教师模型,对各个训练图像中的训练对象进行目标检测处理,得到各个训练对象的第一检测结果和各个训练对象的第一检测结果的置信度;将各个训练图像输入至目标检测学生模型,对各个训练图像中的训练对象进行目标检测处理,得到各个训练对象的第二检测结果和各个训练对象的第二检测结果的置信度;基于各个第一检测结果和各个第一检测结果的置信度以及各个第二检测结果和各个第二检测结果的置信度进行软标签生成处理,得到对应的各个训练对象的类别软标签和检测框软标签;基于各个训练对象的类别软标签和各个训练对象的第二检测结果,计算得到对应的各个第一类别损失值;基于各个训练对象的检测框软标签和各个训练对象的第二检测结果,计算得到对应的各个第一检测框损失值;基于各个训练对象的第二检测结果以及各个训练对象的标签,分别计算得到对应的各个第二类别损失值和各个第二检测框损失值;基于各个第一类别损失值和各个第二类别损失值以及各个第一检测框损失值和各个第二检测框损失值,确定各个目标损失值,并根据各个目标损失值更新目标检测学生模型的参数;在目标损失值小于或等于预设值时,得到训练完成的目标检测学生模型。

3、本公开实施例的第二方面,提供了一种基于软标签生成的目标检测模型的训练装置,包括:获取模块,用于获取目标检测训练集,目标检测训练集包括多张训练图像和多张训练图像的标签,标签包括类别标签和检测框标签,类别标签用于表示对应训练图像上的训练对象的真实类别,检测框标签用于表示对应训练图像上的训练对象在训练图像上的位置的真实检测框;训练模块,用于利用目标检测训练集对目标检测教师模型进行训练,得到训练完成的目标检测教师模型;第一检测模块,用于将各个训练图像输入至目标检测教师模型,对各个训练图像中的训练对象进行目标检测处理,得到各个训练对象的第一检测结果和各个训练对象的第一检测结果的置信度;第二检测模块,用于将各个训练图像输入至目标检测学生模型,对各个训练图像中的训练对象进行目标检测处理,得到各个训练对象的第二检测结果和各个训练对象的第二检测结果的置信度;软标签生成模块,用于基于各个第一检测结果和各个第一检测结果的置信度以及各个第二检测结果和各个第二检测结果的置信度进行软标签生成处理,得到对应的各个训练对象的类别软标签和检测框软标签;第一计算模块,用于基于各个训练对象的类别软标签和各个训练对象的第二检测结果,计算得到对应的各个第一类别损失值;基于各个训练对象的检测框软标签和各个训练对象的第二检测结果,计算得到对应的各个第一检测框损失值;第二计算模块,用于基于各个训练对象的第二检测结果以及各个训练对象的标签,分别计算得到对应的各个第二类别损失值和各个第二检测框损失值;更新模块,用于基于各个第一类别损失值和各个第二类别损失值以及各个第一检测框损失值和各个第二检测框损失值,确定各个目标损失值,并根据各个目标损失值更新目标检测学生模型的参数;结束模块,用于在目标损失值小于或等于预设值时,得到训练完成的目标检测学生模型。

4、本公开实施例的第三方面,提供了一种电子设备,包括存储器、处理器以及存储在存储器中并且可在处理器上运行的计算机程序,该处理器执行计算机程序时实现上述方法的步骤。

5、本公开实施例的第四方面,提供了一种可读存储介质,该可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述方法的步骤。

6、本公开实施例与现有技术相比存在的有益效果是:将各个训练图像输入至训练完成的目标检测教师模型,得到各个训练对象第一检测结果和各个训练对象第一检测结果的置信度,第一检测结果包括训练对象的类别以及训练对象在训练图像上的位置;将各个训练图像输入至训练完成的目标检测学生模型,得到各个训练对象第二检测结果和各个训练对象第二检测结果的置信度;根据各个训练对象第一检测结果和各个训练对象第一检测结果的置信度以及各个训练对象第二检测结果和各个训练对象第二检测结果的置信度进行软标签生成处理,通过训练更合理的方式产生软标签来约束目标检测学生模型的学习,得到对应的各个训练对象的类别软标签和检测框软标签;并联合各个训练对象的类别软标签和检测框软标签以及各个训练对象的类别标签和检测框标签对目标检测学生模型进行训练,更新目标检测学生模型的参数,得到训练完成的目标检测学生模型。本公开提供的目标检测模型的训练方法提出了一种软标签生成的方法,综合考虑了目标检测学生模型和目标检测教师模型的输出结果并确定软标签,解决现有技术中目标检测教师模型的错误输出影响目标检测学生模型的性能的问题,在加快收敛目标检测学生模型的过程提高训练速度之时,提高了目标检测学生模型的性能,从而提升了知识蒸馏的效果。

本文档来自技高网...

【技术保护点】

1.一种基于软标签生成的目标检测模型的训练方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述基于各个所述第一检测结果和各个所述第一检测结果的置信度以及各个所述第二检测结果和各个所述第二检测结果的置信度进行软标签生成处理,得到对应的各个所述训练对象的类别软标签和检测框软标签,包括:

3.根据权利要求2所述的方法,其特征在于,所述初步第一检测结果包括初步第一类别结果和初步第一检测框结果,所述初步第二检测结果包括初步第一类别结果和初步第二检测框结果,所述根据各个所述初步第一检测结果和对应的各个所述初步第一检测结果的置信度以及各个所述初步第二检测结果和对应的各个所述初步第二检测结果的置信度,确定各个所述训练对象的类别软标签和检测框软标签,包括:

4.根据权利要求1所述的方法,其特征在于,所述将各个所述训练图像输入至目标检测学生模型,对各个所述训练图像中的所述训练对象进行目标检测处理,得到各个所述训练对象的第二检测结果和各个所述训练对象的第二检测结果的置信度,包括:

5.根据权利要求4所述的方法,其特征在于,所述训练图像的至少两个特征图包括至少一个所述训练图像的低层特征图和一个所述训练图像的高层特征图,所述通过所述目标检测学生模型的特征金字塔网络对各个所述训练图像的至少两个特征图进行特征融合,得到各个所述训练图像的融合特征图包括:

6.根据权利要求4所述的方法,其特征在于,所述根据各个所述训练图像的融合特征图,确定各个所述训练图像中的各个所述训练对象的第二检测结果和各个所述训练对象的第二检测结果的置信度包括:

7.根据权利要求1至6中任一项所述的方法,其特征在于,所述在所述目标损失值小于或等于预设值时,得到训练完成的目标检测学生模型之后,还包括:

8.一种基于软标签生成的目标检测模型的训练装置,其特征在于,包括:

9.一种电子设备,包括存储器、处理器以及存储在所述存储器中并且可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述方法的步骤。

10.一种可读存储介质,所述可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述方法的步骤。

...

【技术特征摘要】

1.一种基于软标签生成的目标检测模型的训练方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述基于各个所述第一检测结果和各个所述第一检测结果的置信度以及各个所述第二检测结果和各个所述第二检测结果的置信度进行软标签生成处理,得到对应的各个所述训练对象的类别软标签和检测框软标签,包括:

3.根据权利要求2所述的方法,其特征在于,所述初步第一检测结果包括初步第一类别结果和初步第一检测框结果,所述初步第二检测结果包括初步第一类别结果和初步第二检测框结果,所述根据各个所述初步第一检测结果和对应的各个所述初步第一检测结果的置信度以及各个所述初步第二检测结果和对应的各个所述初步第二检测结果的置信度,确定各个所述训练对象的类别软标签和检测框软标签,包括:

4.根据权利要求1所述的方法,其特征在于,所述将各个所述训练图像输入至目标检测学生模型,对各个所述训练图像中的所述训练对象进行目标检测处理,得到各个所述训练对象的第二检测结果和各个所述训练对象的第二检测结果的置信度,包括:

5.根据权利要求4所述的方法,其特征在于,所述训练图像...

【专利技术属性】
技术研发人员:蒋召周靖宇
申请(专利权)人:深圳须弥云图空间科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1