本发明专利技术公开一种基于改进YOLO V5的无人机航拍图像目标检测方法,属于深度学习和目标检测领域。该方法首先利用无人机航拍图像构建相关数据集,然后在YOLO V5主干网络部分利用卷积层替换Focus模块中的切片层,接着利用Neck部分对图像特征进一步处理,然后针对无人机高空航拍视角带来的目标杂散分布且目标占像素比过小问题,在网络预测层部分优化剔除76
【技术实现步骤摘要】
基于改进YOLO V5的无人机航拍图像目标检测方法
[0001]本专利技术涉及一种基于改进YOLO V5的无人机航拍图像目标检测方法,属于深度学习和目标检测
技术介绍
[0002]无人机影像的智能化感知不仅可以高效地提取地物信息,还能拓展无人机的场景理解能力,为无人机自主探测和飞行提供技术支持。目标检测是提升无人机影像智能感知的关键技术之一,但无人机航拍图像一般存在背景复杂、目标分布密集、尺度小、同一类别目标的角度差异大等特征。传统的“基于手动特征提取+分类器”的目标检测算法己无法满足复杂环境和多尺度下的检测精度要求。随着深度学习在解决图像处理上表现出的高效实用性,利用深度学习实现航拍图像深度变化特征的提取可有效避免传统方法的缺陷。
[0003]当前,随着深度神经网络的发展,目标检测领域的研究基本上分为两个方向,一个是基于候选区域的双阶段目标检测算法,如Faster
‑
RCNN;另外一个是基于回归计算的单阶段目标检测方法,如YOLO V5。基于候选区域的双阶段的目标检测算法虽然精度很高,但是检测效率不高。而单阶段目标检测方法如2020年提出的YOLO V5,其在VOC 2007/2012数据集上可达到推理时间0.007秒。与Faster
‑
RCNN相比,YOLO V5的推理速度提高了3倍,且具有更高的精度。
[0004]针对无人机航拍特殊环境,基于YOLO V5的目标检测方法面临如下两个难题。第一,无人机高空俯拍目标属于小目标,其占像素比例小,检测难度大;第二,无人机载荷小,电源供能有限,需通过提高网络推理速度,来提高其单次飞行作业效率。因此,在提高原有精度的前提下,改进YOLO V5主干网络架构,轻量化其网络模型,并提高其推理速度,对于YOLO V5应用到无人机航拍图像目标检测领域具有重要意义。
技术实现思路
[0005]本专利技术的目的是针对YOLO V5应用到无人机航拍图像目标检测中存在的因检测目标聚集为小目标,导致检测难度大,和主干网络复杂,导致实时性不够的问题,提出一种基于改进YOLO V5的无人机航拍目标检测方法,其可在提高原有YOLO V5精度的前提下,改进YOLO V5主干网络架构,轻量化其网络模型,提高其推理速度,实现快速、准确的无人机航拍目标检测。
[0006]上述的目的通过以下技术方案实现:
[0007]一种基于改进YOLO V5的无人机航拍目标检测方法,该方法包括如下步骤:
[0008](1)利用无人机航拍图像构建数据集:对无人机航拍图像进行分类和标注后,得到带有类别标签的图像数据集,将带有类别标签的图像数据集划分为训练集和测试集,其中80%作为训练集,20%作为测试集;
[0009](2)对步骤(1)得到的带有类别标签的图像数据集,进行预处理操作得到特征图,并将预处理后的特征图输入到改进的YOLO V5网络获取不同尺度的无人机航拍图像特征
图;改进的YOLO V5网络是指在主干网络部分利用卷积层替换Focus模块中的切片层,并依次分别串联卷积层模块、跨阶段局部网络、空间金字塔池化模块;
[0010](3)对步骤(2)得到的不同尺度的无人机航拍图像特征图,将其输入到改进的YOLO V5网络中的Neck部分,Neck部分对不同尺度的无人机航拍图像特征图进行上采样和特征融合后获得不同尺度的张量数据;
[0011](4)对步骤(3)得到的不同尺度的张量数据,将其输入到改进的YOLO V5网络中的预测层部分,在预测层部分优化剔除大检测头与自适应调整锚框,最终计算得到无人机航拍目标的检测框;
[0012](5)对步骤(4)得到的无人机航拍目标的检测框,利用泛化交并比、平均精度与推理速度3个参数进行评价。
[0013]进一步地,步骤(2)的具体方法是:
[0014](21)在YOLO V5网络的主干网络部分将Focus模块中的切片层替换为卷积层,即将切片操作用卷积操作替换来进行特征提取;接着将特征图输出到卷积层模块处理特征图的传播出现梯度消失的问题,卷积层模块由卷积、批量归一化、Leaky激活函数构成,其中批量归一化定义如下:
[0015][0016]式中,为归一化损失函数,x
(k)
为经过该层线性变换后的损失函数值,E[
·
]表示损失函数值的均值,Var是均方差操作符;
[0017]Leaky激活函数定义如下:
[0018][0019]式中,f(i)为Leaky激活函数,i表示特征图输入值;
[0020](22)将步骤(21)处理后的特征图输入到跨阶段局部网络模块进行优化处理,减小网络模型尺寸;
[0021](23)将步骤(22)处理后的特征图输入到空间金字塔池化模块,空间金字塔池化模块利用空间金字塔池化操作对输入的特征图进行处理,获得多尺度的无人机航拍图像特征图。
[0022]进一步地,步骤(3)的具体方法是:
[0023]将步骤(2)得到的多尺度图像特征图输入到改进的YOLO V5网络中的Neck部分,Neck部分由卷积层模块、跨阶段局部网络、系列特征融合模块、上采样模块组成,Neck在特征金字塔网络的基础上引入了自下而上的路径增强结构,细化主干网络输出的图像特征矩阵,并输出不同尺度的张量数据。
[0024]进一步地,步骤(4)的具体方法是:
[0025]将步骤(3)得到的不同尺度的张量数据输入到改进的YOLO V5网络中的预测层部分,预测层由卷积层和三个大小分别为76
×
76
×
255、38
×
38
×
255、19
×
19
×
255的检测头组成;首先将针对大目标的76
×
76
×
255的检测头优化剔除,接着自适应调整锚框,即将原始的锚框调整为[10,14,23,27,37,58]与[81,82,135,169,344,319],最后基于损失函数及反向传播输出无人机航拍目标的检测框。
[0026]进一步地,步骤(5)的具体方法是:
[0027]泛化交并比为回归目标框损失函数,其计算公式如下:
[0028][0029][0030]式中,GIOU表示泛化交并比,IOU表示交并比,A、B表示任意的两个无人机航拍目标的检测框,C表示一个能够包住A,B的最小方框,|C\A∪B|表示为C减去A与B并集的面积,|C|表示为C的面积,|A∪B|表示A框与B框并集的面积,|A∩B|表示A框与B框交集的面积;
[0031]采用平均精度作为衡量多标签图像检测精度的指标,平均精度通过绘制PR曲线计算得到,即以precision和recall作为纵、横轴坐标的二维曲线,precision为准确率,recall为召回率;推理速度定义为一秒钟可检测图像的数目。
附图说明
[0032]图1本专利技术原理示意图;
[0本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于改进YOLO V5的无人机航拍图像目标检测方法,其特征在于,该方法包括如下步骤:(1)利用无人机航拍图像构建数据集:对无人机航拍图像进行分类和标注后,得到带有类别标签的图像数据集,将带有类别标签的图像数据集划分为训练集和测试集,其中80%作为训练集,20%作为测试集;(2)对步骤(1)得到的带有类别标签的图像数据集,进行预处理操作得到特征图,并将预处理后的特征图输入到改进的YOLO V5网络获取不同尺度的无人机航拍图像特征图;改进的YOLO V5网络是指在主干网络部分利用卷积层替换Focus模块中的切片层,并依次分别串联卷积层模块、跨阶段局部网络、空间金字塔池化模块;(3)对步骤(2)得到的不同尺度的无人机航拍图像特征图,将其输入到改进的YOLO V5网络中的Neck部分,Neck部分对不同尺度的无人机航拍图像特征图进行上采样和特征融合后获得不同尺度的张量数据;(4)对步骤(3)得到的不同尺度的张量数据,将其输入到改进的YOLO V5网络中的预测层部分,在预测层部分优化剔除大检测头与自适应调整锚框,最终计算得到无人机航拍目标的检测框;(5)对步骤(4)得到的无人机航拍目标的检测框,利用泛化交并比、平均精度与推理速度3个参数进行评价。2.根据权利要求1所述的基于改进YOLO V5的无人机航拍图像目标检测方法,其特征在于,步骤(2)的具体方法是:(21)在YOLO V5网络的主干网络部分将Focus模块中的切片层替换为卷积层,即将切片操作用卷积操作替换来进行特征提取;接着将特征图输出到卷积层模块处理特征图的传播出现梯度消失的问题,卷积层模块由卷积、批量归一化、Leaky激活函数构成,其中批量归一化定义如下:式中,为归一化损失函数,x
(k)
为经过该层线性变换后的损失函数值,E[
·
]表示损失函数值的均值,Var是均方差操作符;Leaky激活函数定义如下:式中,f(i)为Leaky激活函数,i表示特征图输入值;(22)将步骤(21)处理后的特征图输入到跨阶段局部网络模块进行优化处理,减小网络模型尺寸;(23)将步骤(22)处理后的特征图输入到空间金字塔池化模块,空间金字塔池化模块利用空间金字塔池化操作对输入的特征图进行处理,获得...
【专利技术属性】
技术研发人员:程向红,曹毅,胡彦钟,张文卓,钱荣辉,
申请(专利权)人:东南大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。