一种基于YOLOV5的任意朝向目标五参数检测方法技术

技术编号:29490969 阅读:37 留言:0更新日期:2021-07-30 19:03
本发明专利技术公开了一种基于YOLOV5的任意朝向目标五参数检测方法,首先利用YOLOV5特有的特征提取网络提取遥感图像特征,实现三种尺度的特征输出,首先从输出特征图上直接回归出目标旋转框的五个参数,利用该五参数解码后的坐标重建特征图,再次回归出更准确的坐标。训练采用最小化smmoth L1损失函数使模型更快更好收敛。本发明专利技术考虑到不同的任务需求与硬件瓶颈,设计了代表不同速度与精度的轻量化加速模型;规模最大模型的检测精度达到了SOTA,而网络深度最小的模型,可以在较高精度上实现接近实时检测的效果,便于搭载在无人机、树莓派等移动端,其应用前景非常广阔。

【技术实现步骤摘要】
一种基于YOLOV5的任意朝向目标五参数检测方法
本专利技术涉及目标检测、图像处理技术、算法与神经网络应用
,尤其涉及一种基于YOLOV5的任意朝向目标五参数检测方法。
技术介绍
随着硬件设备的提升和遥感技术的不断成熟,基于卫星、雷达、无人机拍摄的遥感图像质量与分辨率已经达到自然图像的水平。然而,遥感图像中的目标有着鲜明的特点:目标均以俯视图的视角展现;目标尺度变化大;车辆、飞机、轮船等特殊物体存在排列方向等信息。采用通用的水平框检测方法检测旋转目标,具有三大缺点:大小和宽高比无法反映目标对象的真实形状如图2a;对象和背景像素没有有效分离如图2b;密集物体之间很难分开如图2c。采用任意方向矩形框对目标进行检测定位,能更好反映物体位置信息如图2d、2e、2f,在地理、农业以及军事上具有重要意义。旋转框检测方法起源于基于深度学习的任意方向的场景文本检测,代表性的算法有:1、以SWT、SelectiveSearch、EdgeBox为代表的传统算法在深度学习方法诞生之前,旋转目标检测、场景倾斜文本检测主要采用SWT、MSER、ER本文档来自技高网...

【技术保护点】
1.一种基于YOLOV5的任意朝向目标五参数检测方法,其特征在于:具体步骤如下:/n(1)将得到的遥感图像输入到Yolov5特征提取网络进行特征提取,得到三个不同尺度的特征图;/n(2)将步骤(1)中得到的特征图进行分类和回归,将回归结果进行特征重构,得到精细化的特征图;/n(3)利用步骤(2)得到的精细化特征图再次进行分类和回归,输出并计算损失。/n

【技术特征摘要】
1.一种基于YOLOV5的任意朝向目标五参数检测方法,其特征在于:具体步骤如下:
(1)将得到的遥感图像输入到Yolov5特征提取网络进行特征提取,得到三个不同尺度的特征图;
(2)将步骤(1)中得到的特征图进行分类和回归,将回归结果进行特征重构,得到精细化的特征图;
(3)利用步骤(2)得到的精细化特征图再次进行分类和回归,输出并计算损失。


2.根据权利要求1所述的一种基于YOLOV5的任意朝向目标五参数检测方法,其特征在于:步骤(1)中在进行Yolov5特征提取网络进行特征提取之前,将遥感图像进行随机翻转、拉伸、色域变换和图像随机灰度化数据增强操作,再统一缩放到一个标准尺寸进行Focus切片操作,而后输入到Yolov5特征提取网络进行特征提取。


3.根据权利要求1所述的一种基于YOLOV5的任意朝向目标五参数检测方法,其特征在于:所述步骤(2)具体内容如下:分别对得到的三个不同尺度的特征图进行分类和回归卷积,将得到的回归参数解码为目标的五参数模型旋转框,而后利用解码后的边界框的位置信息重新编码对应的特征点,重构整个特征映射,将新的特征映射进行归一化操作,并作为掩模点乘到原有特征图上,得到精细化的特征图,具体实现过程为:根据三个不同尺度的特征图产生的类别得分图作为掩模,每个特征点只保留得分最高的预测框:而后根据预测框的五个坐标即中心点和四个顶点在特征图上获得对应的特征向量,利用坐标的位置信息双线性插值得到精确的特征向量;遍历特征点之后,重构特...

【专利技术属性】
技术研发人员:席智中孙玉绘王金根张明义范希辉张罗政朱静陈代梅许蒙恩
申请(专利权)人:中国人民解放军陆军炮兵防空兵学院
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1