一种基于YOLOv5s改进的轻量模型目标检测方法技术

技术编号:38500066 阅读:15 留言:0更新日期:2023-08-15 17:08
本发明专利技术公开一种基于YOLOv5s改进的轻量模型目标检测方法,目标检测方法通过在基于YOLOv5s改进的轻量模型中融入了全局注意力机制,加强了通道与空间注意力机制之间的跨维度特征信息交互能力,减少目标特征因不同维度而丢失的问题,提高目标的特征提取;同时在检测头处结合自适应空间特征融合算法,通过自适应的调整各个尺度在融合时的空间权重,抑制空间尺度不一致性,使目标特征获得更加精准的网络处理比重,从而提高目标的多尺度特征融合能力,降低遥感图像中中小目标的漏检率和误检率。率。率。

【技术实现步骤摘要】
一种基于YOLOv5s改进的轻量模型目标检测方法


[0001]本专利技术涉及深度学习和图像处理领域,具体是一种基于YOLOv5s改进的轻量模型目标检测方法。

技术介绍

[0002]遥感图像目标检测是目标检测任务中的重要组成部分。随着卫星技术的快速发展,遥感卫星的重要性日渐突出,在自然资源监察,城市发展,土地利用,卫星导航等众多领域被广泛利用。遥感卫星不同于其它雷达载具会受到自然天气的影响,其主要通过在轨卫星进行对目标区域进行拍摄,具有全天候,全天时,全疆域等优势,但在轨卫星拍摄的图片覆盖面积广,分辨率高,目标种类繁多且尺度不一,导致小目标在图像中占取的像素很少。研究表明,像素低于40*40的小目标在提取特征时,很可能会泯灭在复杂背景中,因此提高遥感图像中目标的检测精度具有很高的研究意义。
[0003]深度学习算法已经成为目标检测的重要方法之一。在基于深度学习算法的目标检测中,主要有两种算法,One

stage算法和Two

stage算法。One

stage算法如SSD,YOLO算法具有高速率,高鲁棒性等优点,在实时目标检测中应用广泛。Two

stage算法如SPP

Net,Faster R

CNN算法具有高精度,但检测速率较慢,所以为了保证目标检测速度的同时,尽可能的提高目标的检测准确率成了目标检测算法中的重要一环。

技术实现思路

[0004]本专利技术的目的在于提供一种基于YOLOv5s改进的轻量模型目标检测方法,通过引入全局注意力模块,结合了空间注意力机制和通道注意力机制之间的跨维特征信息交互,提高模型对目标的特征提取。在输出端通过自适应空间特征融合检测头模块,通过自适应学习各尺度特征之间的空间权重,可以更加准确的学习各个目标的尺度特性提高目标的多尺度特征融合,降低了遥感图像中目标的漏检率和误检率。
[0005]本专利技术的目的可以通过以下技术方案实现:
[0006]一种基于YOLOv5s改进的轻量模型目标检测方法,所述目标检测方法包括以下步骤:
[0007]步骤1、选择数据集。
[0008]步骤2、对数据集进行预处理。
[0009]步骤3、改进注意力机制,将预处理后的数据在基础的轻量级YOLOv5s中融入全局注意力机制。
[0010]步骤4、改进特征融合机制,经过步骤3处理后,通过自适应特征融合对经历过特征提取后的特征图进行特征融合。
[0011]步骤5、经过步骤3和步骤4将网络输出的图像送入检测头,通过损失函数计算预测损失,构建基于YOLOv5s改进的轻量模型。
[0012]步骤6、通过数据集对改进的轻量模型进行测试和验证。
[0013]步骤7、根据步骤6测试与验证的结果,对改进的轻量模型的指标进行评价。
[0014]进一步的,所述改进注意力机制通过在基础的轻量级YOLOv5s中融入全局注意力机制,将通道注意力和空间注意力二者联系起来,加强空间和通道两个方面的特征提取,通过增强两个注意力维度间的特征信息交互,获取更加细致的特征纹理,提高中小目标的特征提取率,以此来提高目标的检测准确率。
[0015]进一步的,所述改进注意力机制具体操作如下:
[0016](1)将三维排列将特征图的维度由ΔC
×
ΔW
×
ΔH置换为ΔW
×
ΔH
×
ΔC,其中ΔC表示输入特征图的通道数,ΔW表示特征图的宽度,ΔH表示特征图的高度。通过两个多层感知机增强了通道与空间之间的跨维度联合,增强检测器对目标的提取,特征提取之后再通过三维逆排列恢复特征维度,其公式如下,
[0017][0018]其中δ表示为sigmoid函数,ρ表示三维排列,表示逆排列,MLP表示多层感知机。
[0019](2)再对输入特征图进行卷积操作,7
×
7的卷积核,填充设为3,从而对通道域进行压缩降维,突出空间域的边缘处目标特征和目标特征差异,得到r表示空间维度降低倍率,
[0020][0021]其中,表示由卷积核为7
×
7,正则化(BN)和ReLU激活函数组成的卷积网络。
[0022]进一步的,所述改进特征融合机制通过步骤3处理后,对提取的目标进行特征的再融合,在特征融合端引入自适应特征融合,通过自适应特征融合对经历过特征提取后的特征图进行特征融合,自适应学习各尺度特征之间的空间权重,提高特征的表征能力,使其自适应融合目标特征。
[0023]进一步的,所述改进特征融合机制具体操作如下:
[0024](1)设三层输出特征映射为x
l
,l∈{1,2,3},设非l层的特征映射为x
n
,由于不同特征层中的特征映射具有不同的分辨率和通道数,通过Conv3*3卷积,步长为2对特征分辨率进行下采样,Conv1*1卷积压缩特征的通道数。不同层间进行拼接,加强了特征的多尺度融合,再通过自适应学习不同尺度特征的空间权重,提高特征的表征能力。特征融合公式如式:
[0025][0026]其中,表示将第n层特征映射的点D(i,j)的特征向量大小调整为与第l层相同,表示输出特征映射y
l
在点D(i,j)处的特征向量。
[0027](2)自适应提取n层到l层的空间权重,其定义如下式:
[0028][0029]其中,且均∈(0,1)。分别表示x1→
l
,x2→
l
,x3→
l
的权重标量映射。
[0030]进一步的,所述步骤7对改进的轻量模型进行评价,评价指标包括平均准确率(Average Precision,AP)和均值平均准确率(mean Average Precision,mAP)评价指标,其公式如下:
[0031][0032][0033]其中,P代表精确率,R代表召回率,P和R的计算公式如下:
[0034][0035][0036]其中,TP(True Positive)表示预测为真且实际为真的样本个数,FP(False Positive)表示预测为真但实际为假的样本个数,FN(False Negative)表示预测为假但实际为真的样本个数。
[0037]本专利技术的有益效果:
[0038]1、本专利技术目标检测方法选择DOTA数据集并对数据集进行预处理,有效的降低高分辨率图像,节省运算成本;
[0039]2、本专利技术目标检测方法利用YOLOv5s的模块化编程思想,可以将其应用于远程边缘设备,节省远端服务器的部署,具有一定的市场前景;
[0040]3、本专利技术目标检测方法通过在基础的轻量级YOLOv5s中融入全局注意力机制,加强空间和通道两个方面的特征提取,同时增强两个注意力维度间的特征信息交互,获取更加细致的特征纹理,提高中小目标的特征提取率,以此来提高目标的检测准确率;...

【技术保护点】

【技术特征摘要】
1.一种基于YOLOv5s改进的轻量模型目标检测方法,其特征在于,所述目标检测方法包括以下步骤:步骤1、选择数据集;步骤2、对数据集进行预处理;步骤3、改进注意力机制,将预处理后的数据在基础的轻量级YOLOv5s中融入全局注意力机制;步骤4、改进特征融合机制,经过步骤3处理后,通过自适应特征融合对经历过特征提取后的特征图进行特征融合;步骤5、经过步骤3和步骤4将网络输出的图像送入检测头,通过损失函数计算预测损失,构建基于YOLOv5s改进的轻量模型;步骤6、通过数据集对改进的轻量模型进行测试和验证;步骤7、根据步骤6测试与验证的结果,对改进的轻量模型的指标进行评价。2.根据权利要求1所述的一种基于YOLOv5s改进的轻量模型目标检测方法,其特征在于,所述改进注意力机制通过在基础的轻量级YOLOv5s中融入全局注意力机制,将通道注意力和空间注意力二者联系起来,加强空间和通道两个方面的特征提取,通过增强两个注意力维度间的特征信息交互,获取更加细致的特征纹理,提高中小目标的特征提取率,以此来提高目标的检测准确率。3.根据权利要求2所述的一种基于YOLOv5s改进的轻量模型目标检测方法,其特征在于,所述改进注意力机制具体操作如下:(1)将三维排列将特征图的维度由ΔC
×
ΔW
×
ΔH置换为ΔW
×
ΔH
×
ΔC,其中ΔC表示输入特征图的通道数,ΔW表示特征图的宽度,ΔH表示特征图的高度;通过两个多层感知机增强了通道与空间之间的跨维度联合,增强检测器对目标的提取,特征提取之后再通过三维逆排列恢复特征维度,其公式如下,其中δ表示为sigmoid函数,ρ表示三维排列,表示逆排列,MLP表示多层感知机;(2)再对输入特征图进行卷积操作,7
×
7的卷积核,填充设为3,从而对通道域进行压缩降维,突出空间域的边缘处目标特征和目标特征差异,得到r表示空间维度降低倍率,其中,表示由卷积核为7
×
7,正则化(BN)和ReLU激活函数组成的卷积网络。4.根据权利要求1所述的一种基于YOLOv5s改进...

【专利技术属性】
技术研发人员:周子龙周杰
申请(专利权)人:南京信息工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1