一种基于知识蒸馏的轻量化SAR图像目标检测方法技术

技术编号:39193418 阅读:12 留言:0更新日期:2023-10-27 08:40
本发明专利技术公开了一种基于知识蒸馏的轻量化SAR图像的目标检测方法,包括:获取待检测的SAR图像;将所述待检测的SAR图像输入至训练好的轻量化的学生网络,得到目标检测结果;其中,以YOLOX

【技术实现步骤摘要】
一种基于知识蒸馏的轻量化SAR图像目标检测方法


[0001]本专利技术属于雷达
,具体涉及一种基于知识蒸馏的轻量化SAR图像的目标检测方法。

技术介绍

[0002]近年来由于网络深度的增加以及计算能力的不断提高,基于深度学习的目标检测方法开始占据主流。目前,基于深度学习的目标检测方法可以分为两类。一类是以Fast R

CNN、Faster R

CNN等为代表的两阶段目标检测算法,此类方法通常会先获取候选区域,然后再对候选区域进行分类与边界框的回归,因此在检测精度上具有优势;另一类是以YOLO、SSD为代表的单阶段目标检测算法,此类方法直接在网络中提取特征来预测物体分类和位置,因此在检测速度上具有优势。Redmon J等人在2016年提出了YOLO算法,但此时的YOLO算法只有速度优势,精度上远不如双阶段目标检测算法。此后为了弥补YOLO算法在检测精度上的劣势,不断有新的YOLO系列算法涌现。2017年Redmon J再次提出YOLOv2,一年后又提出YOLOv3。2020年Bochkovskiy A等人以及Ultralytics公司相继提出YOLOv4以及YOLOv5。2021年,Ge Z等人提出YOLOX。2022年,Xu S等人提出PP

YOLOE,美团团队提出YOLOv6,Bochkovskiy A等人提出YOLOv7。纵观YOLO系列算法的发展历程,YOLO系列的目标检测新方法往往会结合当前目标检测领域的最新进展,追求模型精度与速度的最佳权衡。
[0003]当前基于卷积神经网络的SAR目标检测方法大多以设计更复杂的模型达到更高的检测精度为目的,但是复杂模型带来了较大的参数量与计算量,这一方面导致模型难以在雷达终端设备中的部署问题,另一方面,由于SAR图像往往是大场景图像,当使用复杂模型检测场景大图时会产生严重的检测耗时,难以满足实时性要求。目前,基于卷积神经网络的模型轻量化的方法大致可分为以下两大类:第一类为结构压缩方法;第二类为参数压缩方法。已有研究表明,通过结构压缩方法能够将深度学习模型的参数量与计算复杂度降低,提高模型在测试阶段的推理判决速度,从而满足模型部署与实时性目标检测的需要,但当这些方法应用于SAR目标检测时,由于SAR场景广阔且复杂,轻量化后的SAR目标检测模型往往会有较大的性能下降,难以满足SAR目标检测的精度要求,因此如何实现精度与速度的最佳权衡,依然需要进一步研究。

技术实现思路

[0004]为了解决现有技术中所存在的上述问题,本专利技术提供了一种基于知识蒸馏的轻量化SAR图像的目标检测方法。
[0005]本专利技术要解决的技术问题通过以下技术方案实现:
[0006]一种基于知识蒸馏的轻量化SAR图像的目标检测方法,所述目标检测方法包括:
[0007]步骤1、获取待检测的SAR图像;
[0008]步骤2、将所述待检测的SAR图像输入至训练好的轻量化的学生网络,得到目标检测结果;
[0009]其中,以YOLOX

S模型为基线构建所述轻量化的学生网络;所述轻量化的学生网络利用训练好的教师网络进行训练,且所述轻量化的学生网络的损失函数包括非蒸馏损失与蒸馏损失,以使所述训练好的轻量化的学生网络结合顶层知识蒸馏与隐层知识蒸馏的知识蒸馏方法进行目标检测,得到目标检测结果。
[0010]可选地,所述教师网络包括改进的YOLOX

X目标检测网络,所述改进的YOLOX

X目标检测网络是通过将YOLOX

X目标检测网络中的定位分支的输出由(cx1,cy1,w1,h1)替换为(l1,t1,r1,b1)得到的网络,所述改进的YOLOX

X目标检测网络的损失函数是通过将所述YOLOX

X目标检测网络的IOU损失函数替换为DFL损失函数与DIoU损失函数之和得到的损失函数,其中,(cx1,cy1)为第一预测框的中心点坐标,w1为第一预测框的宽度,h1为第一预测框的宽度,l1、t1、r1、b1为第一预测框的中心点到第一预测框的四条边框的距离。
[0011]可选地,以YOLOX

S模型为基线构建所述轻量化的学生网络,具体包括:
[0012]在YOLOX

S模型的基础上,将YOLOX

S模型的backbone替换为MobileNetv3

small,在MobileNetv3

small与YOLOX

S模型的Neck之间添加引导卷积模块,且YOLOX

S模型中的所有3*3卷积替换为深度可分离卷积,并将YOLOX

S模型中的定位分支的输出由(cx2,cy2,w2,h2)替换为(l2,t2,r2,b2),其中,(cx2,cy2)为第二预测框的中心点坐标,w2为第二预测框的宽度,h2为第二预测框的宽度,l2、t2、r2、b2为第二预测框的中心点到第二预测框的四条边框的距离。
[0013]可选地,所述轻量化的学生网络的训练方法包括:
[0014]S1、获取SAR数据训练集,所述SAR数据训练集包括多个带真实标签的SAR训练图像;
[0015]S2、训练教师网络,得到训练好的教师网络,所述训练好的教师网络的参数固定不变;
[0016]S3、将若干所述SAR训练图像分别输入所述训练好的教师网络和所述轻量化的学生网络,得到所述训练好的教师网络输出的若干第一向量、所述训练好的教师网络的backbone输出的第一特征图、所述训练好的教师网络的Neck输出的第二特征图、所述轻量化的学生网络输出的若干第二向量、所述轻量化的学生网络的MobileNetv3

small输出的第三特征图以及所述轻量化的学生网络的Neck输出的第四特征图;
[0017]S4、利用所述第一向量、所述第一特征图、所述第二特征图、所述第二向量、所述第三特征图和所述第四特征图计算所述轻量化的学生网络的损失函数;
[0018]S5、基于S4所计算的所述轻量化的学生网络的损失函数,利用梯度下降法对所述轻量化的学生网络各层的参数进行更新,得到更新后的轻量化的学生网络;
[0019]S6、重复执行S3至S5,直至所述更新后的轻量化的学生网络收敛,得到所述训练好的轻量化的学生网络。
[0020]可选地,步骤S3包括:
[0021]S3.1、对所述轻量化的学生网络进行随机初始化;
[0022]S3.2、从所述SAR数据训练集中随机选取N个带真实标签的SAR训练图像,并将N个带真实标签的SAR训练图像分别输入所述训练好的教师网络和所述轻量化的学生网络,得到所述训练好的教师网络输出的若干第一向量、所述训练好的教师网络的backbone输出的第一特征图、所述训练好的教师网络的Neck输出的第二特征图、所述轻量化的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于知识蒸馏的轻量化SAR图像的目标检测方法,其特征在于,所述目标检测方法包括:步骤1、获取待检测的SAR图像;步骤2、将所述待检测的SAR图像输入至训练好的轻量化的学生网络,得到目标检测结果;其中,以YOLOX

S模型为基线构建所述轻量化的学生网络;所述轻量化的学生网络利用训练好的教师网络进行训练,且所述轻量化的学生网络的损失函数包括非蒸馏损失与蒸馏损失,以使所述训练好的轻量化的学生网络结合顶层知识蒸馏与隐层知识蒸馏的知识蒸馏方法进行目标检测,得到目标检测结果。2.根据权利要求1所述的目标检测方法,其特征在于,所述教师网络包括改进的YOLOX

X目标检测网络,所述改进的YOLOX

X目标检测网络是通过将YOLOX

X目标检测网络中的定位分支的输出由(cx1,cy1,w1,h1)替换为(l1,t1,r1,b1)得到的网络,所述改进的YOLOX

X目标检测网络的损失函数是通过将所述YOLOX

X目标检测网络的IOU损失函数替换为DFL损失函数与DIoU损失函数之和得到的损失函数,其中,(cx1,cy1)为第一预测框的中心点坐标,w1为第一预测框的宽度,h1为第一预测框的宽度,l1、t1、r1、b1为第一预测框的中心点到第一预测框的四条边框的距离。3.根据权利要求2所述的目标检测方法,其特征在于,以YOLOX

S模型为基线构建所述轻量化的学生网络,具体包括:在YOLOX

S模型的基础上,将YOLOX

S模型的backbone替换为MobileNetv3

small,在MobileNetv3

small与YOLOX

S模型的Neck之间添加引导卷积模块,且YOLOX

S模型中的所有3*3卷积替换为深度可分离卷积,并将YOLOX

S模型中的定位分支的输出由(cx2,cy2,w2,h2)替换为(l2,t2,r2,b2),其中,(cx2,cy2)为第二预测框的中心点坐标,w2为第二预测框的宽度,h2为第二预测框的宽度,l2、t2、r2、b2为第二预测框的中心点到第二预测框的四条边框的距离。4.根据权利要求3所述的目标检测方法,其特征在于,所述轻量化的学生网络的训练方法包括:S1、获取SAR数据训练集,所述SAR数据训练集包括多个带真实标签的SAR训练图像;S2、训练教师网络,得到训练好的教师网络,所述训练好的教师网络的参数固定不变;S3、将若干所述SAR训练图像分别输入所述训练好的教师网络和所述轻量化的学生网络,得到所述训练好的教师网络输出的若干第一向量、所述训练好的教师网络的backbone输出的第一特征图、所述训练好的教师网络的Neck输出的第二特征图、所述轻量化的学生网络输出的若干第二向量、所述轻量化的学生网络的MobileNetv3

small输出的第三特征图以及所述轻量化的学生网络的Neck输出的第四特征图;S4、利用所述第一向量、所述第一特征图、所述第二特征图、所述第二向量、所述第三特征图和所述第四特征图计算所述轻量化的学生网络的损失函数;S5、基于S4所计算的所述轻量化的学生网络的损失函数,利用梯度下降法对所述轻量化的学生网络各层的参数进行更新,得到更新后的轻量化的学生网络;S6、重复执行S3至S5...

【专利技术属性】
技术研发人员:杜兰麻弘扬郭昱辰周宇
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1