基于改进YOLOV5的无人机航拍图像目标检测方法技术

技术编号：31496048 阅读：25 留言：0更新日期：2021-12-18 12:37

本发明专利技术公开一种基于改进YOLO V5的无人机航拍图像目标检测方法，属于深度学习和目标检测领域。该方法首先利用无人机航拍图像构建相关数据集，然后在YOLO V5主干网络部分利用卷积层替换Focus模块中的切片层，接着利用Neck部分对图像特征进一步处理，然后针对无人机高空航拍视角带来的目标杂散分布且目标占像素比过小问题，在网络预测层部分优化剔除76

全部详细技术资料下载

【技术实现步骤摘要】
基于改进YOLO V5的无人机航拍图像目标检测方法

[0001]本专利技术涉及一种基于改进YOLO V5的无人机航拍图像目标检测方法，属于深度学习和目标检测

技术介绍

[0002]无人机影像的智能化感知不仅可以高效地提取地物信息，还能拓展无人机的场景理解能力，为无人机自主探测和飞行提供技术支持。目标检测是提升无人机影像智能感知的关键技术之一，但无人机航拍图像一般存在背景复杂、目标分布密集、尺度小、同一类别目标的角度差异大等特征。传统的“基于手动特征提取+分类器”的目标检测算法己无法满足复杂环境和多尺度下的检测精度要求。随着深度学习在解决图像处理上表现出的高效实用性，利用深度学习实现航拍图像深度变化特征的提取可有效避免传统方法的缺陷。
[0003]当前，随着深度神经网络的发展，目标检测领域的研究基本上分为两个方向，一个是基于候选区域的双阶段目标检测算法，如Faster
‑
RCNN；另外一个是基于回归计算的单阶段目标检测方法，如YOLO V5。基于候选区域的双阶段的目标检测算法虽然精度很高，但是检测效率不高。而单阶段目标检测方法如2020年提出的YOLO V5，其在VOC 2007/2012数据集上可达到推理时间0.007秒。与Faster
‑
RCNN相比，YOLO V5的推理速度提高了3倍，且具有更高的精度。
[0004]针对无人机航拍特殊环境，基于YOLO V5的目标检测方法面临如下两个难题。第一，无人机高空俯拍目标属于小目标，其占像素比例小，检测难度大；...

【技术保护点】

【技术特征摘要】
1.一种基于改进YOLO V5的无人机航拍图像目标检测方法，其特征在于，该方法包括如下步骤：(1)利用无人机航拍图像构建数据集：对无人机航拍图像进行分类和标注后，得到带有类别标签的图像数据集，将带有类别标签的图像数据集划分为训练集和测试集，其中80％作为训练集，20％作为测试集；(2)对步骤(1)得到的带有类别标签的图像数据集，进行预处理操作得到特征图，并将预处理后的特征图输入到改进的YOLO V5网络获取不同尺度的无人机航拍图像特征图；改进的YOLO V5网络是指在主干网络部分利用卷积层替换Focus模块中的切片层，并依次分别串联卷积层模块、跨阶段局部网络、空间金字塔池化模块；(3)对步骤(2)得到的不同尺度的无人机航拍图像特征图，将其输入到改进的YOLO V5网络中的Neck部分，Neck部分对不同尺度的无人机航拍图像特征图进行上采样和特征融合后获得不同尺度的张量数据；(4)对步骤(3)得到的不同尺度的张量数据，将其输入到改进的YOLO V5网络中的预测层部分，在预测层部分优化剔除大检测头与自适应调整锚框，最终计算得到无人机航拍目标的检测框；(5)对步骤(4)得到的无人机航拍目标的检测框，利用泛化交并比、平均精度与推理速度3个参数进行评价。2.根据权利要求1所述的基于改进YOLO V5的无人机航拍图像目标检测方法，其特征在于，步骤(2)的具体方法是：(21)在YOLO V5网络的主干网络部分将Focus模块中的切片层替换为卷积层，即将切片操作用卷积操作替换来进行特征提取；接着将特征图输出到卷积层模块处理特征图的传播出现梯度消失的问题，卷积层模块由卷积、批量归一化、Leaky激活函数构成，其中批量归一化定义如下：式中，为归一化损失函数，x
(k)
为经过该层线性变换后的损失函数值，E[
·
]表示损失函数值的均值，Var是均方差操作符；Leaky激活函数定义如下：式中，f(i)为Leaky激活函数，i表示特征图输入值；(22)将步骤(21)处理后的特征图输入到跨阶段局部网络模块进行优化处理，减小网络模型尺寸；(23)将步骤(22)处理后的特征图输入到空间金字塔池化模块，空间金字塔池化模块利用空间金字塔池化操作对输入的特征图进行处理，获得...

【专利技术属性】
技术研发人员：程向红，曹毅，胡彦钟，张文卓，钱荣辉，
申请(专利权)人：东南大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人