System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 学生网络模型训练方法、目标检测方法以及相关设备技术_技高网

学生网络模型训练方法、目标检测方法以及相关设备技术

技术编号:41123838 阅读:4 留言:0更新日期:2024-04-30 17:50
本申请公开了一种学生网络模型训练方法、目标检测方法以及相关设备,该方法包括:将训练图像分别输入教师网络模型和学生网络模型进行图像特征提取处理,得到教师网络模型输出的第一训练特征图像和学生网络模型输出的第二训练特征图像;计算第一训练特征图像和第二训练特征图像之间的第一蒸馏损失;将第一训练特征图像输入教师网络模型,得到第一参照目标区域,将第二训练特征图像输入学生网络模型,得到第二参照目标区域;基于注意力机制计算第一参照目标区域的区域特征与第二参照目标区域的区域特征之间的第二蒸馏损失;基于第一蒸馏损失和第二蒸馏损失之间的蒸馏损失和变小为目标训练学生网络模型。上述方案,能够提高网络模型的目标检测精度。

【技术实现步骤摘要】

本申请涉及图像处理,特别是涉及一种学生网络模型训练方法、目标检测方法、装置、电子设备及计算机可读存储介质。


技术介绍

1、基于深度学习的目标检测方法广泛应用于智能监控和自动驾驶等领域,目标检测网络模型也得到相对迅速的发展。在目标检测过程中,除了要准确地检测出目标的位置和类别,还需要尽可能降低模型运行的耗时和所需内存,这对于检测算法的部署有非常重要的意义。

2、目前,是将整个特征图用于训练目标检测模型,而特征图中大量无用的背景信息,降低了模型运行耗时和所需内存,损害了目标检测网络的检测精度。

3、因此,如何得到目标检测准确性更高的目标检测模型,是目前亟待解决的问题。


技术实现思路

1、本申请至少提供一种学生网络模型训练方法、目标检测方法、装置、电子设备以及计算机可读存储介质。

2、本申请第一方面提供了一种学生网络模型训练方法,包括:将训练图像分别输入教师网络模型和所述学生网络模型进行图像特征提取处理,得到所述教师网络模型输出的第一训练特征图像和所述学生网络模型输出的第二训练特征图像;计算所述第一训练特征图像和所述第二训练特征图像之间的第一蒸馏损失;将所述第一训练特征图像输入所述教师网络模型中进行检测处理,得到所述教师网络模型输出的第一训练特征图像中的第一参照目标区域,将所述第二训练特征图像输入所述学生网络模型中进行检测处理,得到所述学生网络模型输出的第二训练特征图像中的第二参照目标区域,所述第一参照目标区域与所述第二参照目标区域在各自所在特征图像中的位置对应;基于注意力机制计算所述第一参照目标区域的区域特征与所述第二参照目标区域的区域特征之间的第二蒸馏损失;基于所述第一蒸馏损失和所述第二蒸馏损失之间的蒸馏损失和变小为目标训练所述学生网络模型。

3、在一实施例中,所述将所述第一训练特征图像输入所述教师网络模型中进行检测处理,得到所述教师网络模型输出的第一训练特征图像中的第一参照目标区域的步骤,包括:获取输入所述教师网络模型中的第一训练特征图像上的预设参照区域库以及所述第一训练特征图像中检测目标的标注信息,所述标注信息包括所述检测目标的位置信息和所述检测目标的尺寸信息;根据所述检测目标的位置信息从所述预设参照区域库中确定至少一个第一参照初始区域;根据所述第一参照初始区域和所述检测目标之间的尺寸信息相似度确定所述第一参照目标区域。

4、在一实施例中,所述尺寸信息包括宽高数值,所述根据所述第一参照初始区域和所述检测目标之间的尺寸信息相似度确定所述第一参照目标区域的步骤,包括:计算所述检测目标的宽高数值与所述第一参照初始区域的宽高数值之间的比值;响应于所述比值小于预设阈值或者所述比值大于所述预设阈值的相反数,则将所述第一参照初始区域确定为所述第一参照目标区域。

5、在一实施例中,基于注意力机制计算所述第一参照目标区域的区域特征与所述第二参照目标区域的区域特征之间的第二蒸馏损失的步骤,还包括:根据所述第一训练特征图像确定注意力权重参数;根据所述第一参照目标区域中各空间位置的区域特征、所述第二参照目标区域中对应空间位置的区域特征以及所述注意力权重参数确定所述第一参照目标区域的区域特征与所述第二参照目标区域的区域特征之间的第二蒸馏损失。

6、在一实施例中,所述注意力权重参数包括所述第一训练特征图像中各空间位置的第一权重系数以及所述第一训练特征图像在不同通道位置上的第二权重系数;所述根据所述第一参照目标区域中各空间位置的区域特征、所述第二参照目标区域中对应空间位置的区域特征以及所述注意力权重参数确定所述第一参照目标区域的区域特征与所述第二参照目标区域的区域特征之间的第二蒸馏损失的步骤,包括:计算所述第二参照目标区域中目标空间位置的区域特征、所述目标空间位置的第一权重系数与所述第一训练特征图像在目标通道位置上的第二权重系数之间的乘积;将所述乘积与所述目标空间位置在所述第一参照目标区域中的区域特征之间的差值作为所述目标空间位置在所述目标通道上的特征损失值;根据所述目标空间位置在所述目标通道上的特征损失值计算参照目标区域中各空间位置在所述目标通道上的特征损失和;根据所述参照目标区域中各空间位置在所述目标通道上的特征损失和计算所述参照目标区域中各空间位置在各通道上的特征损失和;将所述参照目标区域中各空间位置在各通道上的特征损失和作为所述第二蒸馏损失。

7、在一实施例中,所述注意力权重参数包括所述第一训练特征图像中各空间位置的第一权重系数以及所述第一训练特征图像在不同通道位置上的第二权重系数;所述根据所述第一训练特征图像确定注意力权重参数的步骤,包括:对所述第一训练特征图像进行卷积处理,得到所述第一训练特征图像中各空间位置的第一权重系数;对所述第一训练特征图像进行池化处理,得到所述第一训练特征图像的特征向量;将所述第一训练特征图像的特征向量进行全连接处理,得到所述第一训练特征图像在不同通道位置上的第二权重系数。

8、本申请第二方面提供了一种目标检测方法,所述方法包括:获取待检测图像;将所述待检测图像输入目标检测模型中,得到所述目标检测模型输出的检测目标;其中,所述目标检测模型为上述任一项训练所得的学生网络模型。

9、本申请第三方面提供了一种模型训练装置,所述装置包括:特征提取模块,用于将训练图像分别输入教师网络模型和所述学生网络模型进行图像特征提取处理,得到所述教师网络模型输出的第一训练特征图像和所述学生网络模型输出的第二训练特征图像;第一计算模块,用于计算所述第一训练特征图像和所述第二训练特征图像之间的第一蒸馏损失;检测模块,用于将所述第一训练特征图像输入所述教师网络模型中进行检测处理,得到所述教师网络模型输出的第一训练特征图像中的第一参照目标区域,将所述第二训练特征图像输入所述学生网络模型中进行检测处理,得到所述学生网络模型输出的第二训练特征图像中的第二参照目标区域,所述第一参照目标区域与所述第二参照目标区域在各自所在特征图像中的位置对应;第二计算模块,用于基于注意力机制计算所述第一参照目标区域的区域特征与所述第二参照目标区域的区域特征之间的第二蒸馏损失;训练模块,用于基于所述第一蒸馏损失和所述第二蒸馏损失之间的蒸馏损失和变小为目标训练所述学生网络模型。

10、本申请第四方面提供了一种电子设备,包括存储器和处理器,处理器用于执行存储器中存储的程序指令,以实现上述学生网络模型训练方法和/或目标检测方法。

11、本申请第五方面提供了一种计算机可读存储介质,其上存储有程序指令,程序指令被处理器执行时实现上述学生网络模型训练方法和/或目标检测方法。

12、上述方案,通过将训练图像分别输入教师网络模型和学生网络模型进行图像特征提取处理,得到教师网络模型输出的第一训练特征图像和学生网络模型输出的第二训练特征图像;计算第一训练特征图像和第二训练特征图像之间的第一蒸馏损失;将第一训练特征图像输入教师网络模型中进行检测处理,得到教师网络模型输出的第一训练特征图像中的第一参照目标区域,将第二训练特征图本文档来自技高网...

【技术保护点】

1.一种学生网络模型训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述的学生网络模型训练方法,其特征在于,所述将所述第一训练特征图像输入所述教师网络模型中进行检测处理,得到所述教师网络模型输出的第一训练特征图像中的第一参照目标区域的步骤,包括:

3.根据权利要求2所述的学生网络模型训练方法,其特征在于,所述尺寸信息包括宽高数值,所述根据所述第一参照初始区域和所述检测目标之间的尺寸信息相似度确定所述第一参照目标区域的步骤,包括:

4.根据权利要求1所述的学生网络模型训练方法,其特征在于,基于注意力机制计算所述第一参照目标区域的区域特征与所述第二参照目标区域的区域特征之间的第二蒸馏损失的步骤,还包括:

5.根据权利要求4所述的学生网络模型训练方法,其特征在于,

6.根据权利要求4所述的学生网络模型训练方法,其特征在于,所述注意力权重参数包括所述第一训练特征图像中各空间位置的第一权重系数以及所述第一训练特征图像在不同通道位置上的第二权重系数;

7.一种目标检测方法,其特征在于,所述方法包括:

8.一种模型训练装置,其特征在于,所述装置包括:

9.一种电子设备,其特征在于,包括存储器和处理器,所述处理器用于执行所述存储器中存储的程序指令,以实现权利要求1至6任一项所述的学生网络模型训练方法和/或权利要求7所述的目标检测方法。

10.一种计算机可读存储介质,其上存储有程序指令,其特征在于,所述程序指令被处理器执行时实现权利要求1至6任一项所述的学生网络模型训练方法和/或权利要求7所述的目标检测方法。

...

【技术特征摘要】

1.一种学生网络模型训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述的学生网络模型训练方法,其特征在于,所述将所述第一训练特征图像输入所述教师网络模型中进行检测处理,得到所述教师网络模型输出的第一训练特征图像中的第一参照目标区域的步骤,包括:

3.根据权利要求2所述的学生网络模型训练方法,其特征在于,所述尺寸信息包括宽高数值,所述根据所述第一参照初始区域和所述检测目标之间的尺寸信息相似度确定所述第一参照目标区域的步骤,包括:

4.根据权利要求1所述的学生网络模型训练方法,其特征在于,基于注意力机制计算所述第一参照目标区域的区域特征与所述第二参照目标区域的区域特征之间的第二蒸馏损失的步骤,还包括:

5.根据权利要求4所述的学生网络模型训练方法,其特...

【专利技术属性】
技术研发人员:杨雪峰余言勋王亚运
申请(专利权)人:浙江大华技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1