当前位置: 首页 > 专利查询>东南大学专利>正文

基于变换器和跳跃路径聚合FPN的航拍目标检测方法技术

技术编号:38213975 阅读:10 留言:0更新日期:2023-07-25 11:22
本发明专利技术公开了一种基于变换器和跳跃路径聚合FPN的航拍目标检测方法,包括:获取待检测的航拍图像数据;将待检测的航拍图像数据输入预先训练好的航拍小目标检测网络模型进行目标检测,得到待检测的航拍图像数据的目标检测结果;其中,航拍小目标检测网络模型为利用可变形卷积和变换器模块结合的深度聚合残差变换网络进行特征提取,利用跳跃路径聚合特征金字塔网络进行特征融合,利用双路路解耦检测头进行目标检测。在无人机航拍视角拍摄的图片中,能够达到更高的检测精度,尤其是在有大量小目标存在的场景中。小目标存在的场景中。小目标存在的场景中。

【技术实现步骤摘要】
基于变换器和跳跃路径聚合FPN的航拍目标检测方法


[0001]本专利技术涉及目标检测
,特别涉及一种基于变换器和跳跃路径聚合FPN的航拍目标检测方法。

技术介绍

[0002]航拍目标检测技术是一种结合了无人机(UAV)、高分辨率摄像头、计算机视觉和深度学习算法的技术,旨在实现对地面目标的自动识别、定位和追踪。近年来,由于无人机技术的快速发展和计算能力的提升,航拍目标检测技术在智能交通、农业监测、安防监控等领域得到了广泛的应用。目标检测技术主要分为传统目标检测方法和基于深度学习的目标检测方法。传统目标检测方法主要包括基于滑动窗口的检测方法、基于聚类的检测方法和基于图像分割的检测方法。这些方法依赖于手工设计的特征提取器,如SIFT、HOG、LBP等,具有计算速度快、实时性好的优点。但是,这些方法对于目标尺寸、形状、姿态、光照等因素的变化较为敏感,容易导致检测性能下降。基于深度学习的目标检测方法主要包括两大类:基于区域的卷积神经网络(R

CNN系列)和基于单阶段的目标检测网络(如YOLO、SSD等)。R

CNN系列方法主要包括R

CNN、Fast R

CNN、Faster R

CNN等。这些方法首先利用区域提议网络(RPN)生成候选目标区域,然后利用卷积神经网络(CNN)对这些区域进行特征提取,并通过全连接层进行目标分类和位置回归。R

CNN系列方法具有较高的检测精度,但计算速度较慢,实时性较差。单阶段目标检测网络如YOLO、SSD等,直接在整幅图像上进行特征提取和目标检测,无需生成候选区域。这些方法具有较快的计算速度和较好的实时性,但检测精度相对较低。
[0003]航拍图像相较于传统地面图像具有以下特点:高分辨率、大视场、视角变化大、目标尺度和姿态多样等。这些特点为航拍目标检测技术提出了更高的要求,使得传统目标检测方法在航拍图像上的表现不尽如人意。针对航拍图像的特点,研究者们提出了许多适应性更强的目标检测方法。其中,一种常见的方法是将深度学习与传统特征提取方法相结合,利用深度学习的强大表征能力和传统特征提取方法的稳定性,提高航拍目标检测的准确性。另一种方法是对现有的深度学习目标检测网络进行改进,如引入多尺度特征融合、注意力机制等,以适应航拍图像中目标尺度和姿态的多样性。但现有的技术在航拍小目标检测领域仍不尽如人意,需要进一步的改进。

技术实现思路

[0004]本专利技术提供一种基于变换器和跳跃路径聚合FPN的航拍目标检测方法,在无人机航拍视角图像上具有很高的小目标检测精度。
[0005]本专利技术第一方面实施例提供一种基于变换器和跳跃路径聚合FPN的航拍目标检测方法,包括以下步骤:获取待检测的航拍图像数据;将所述待检测的航拍图像数据输入预先训练好的航拍小目标检测网络模型进行目标检测,得到所述待检测的航拍图像数据的目标检测结果;其中,所述航拍小目标检测网络模型为利用可变形卷积和变换器模块结合的深
度聚合残差变换网络进行特征提取,利用跳跃路径聚合特征金字塔网络进行特征融合,利用双路路解耦检测头进行目标检测。
[0006]可选地,在本专利技术的一个实施例中,所述航拍小目标检测网络模型包括骨干网络、颈部网络、区域提取网络、感兴趣区域池化层和检测头;
[0007]所述骨干网络包括一个起始处理层和四个阶段处理层,起始处理层由3个3x3卷积和一个最大池化层组成;每个阶段处理层由多个结合可变形卷积和变换器的聚合残差变换瓶颈层级联组成,通过所述四个阶段处理层输出航拍图像数据的四层特征图;
[0008]所述颈部网络包括所述跳跃路径聚合特征金字塔网络,用于从所述骨干网络获取所述四层特征图,并经过卷积模块降低通道后输入所述跳跃路径聚合特征金字塔网络,所述跳跃路径聚合特征金字塔网络的输出送入所述区域提取网络和所述感兴趣区域池化层;
[0009]所述区域提取网络用于生成候选区域;
[0010]所述感兴趣区域池化层用于利用所述区域提取网络生成的候选区域在所述跳跃路径聚合特征金字塔网络输出的特征图上进行感兴趣区域特征图提取,利用感兴趣区域池化使得所有特征图输出尺寸相同,并将特征图送入所述检测头;
[0011]所述检测头为级联RCNN多阶段结构,每个阶段使用双路解耦检测头,对于所述感兴趣区域池化层输出的特征图,一路使用四个卷积层处理后进行边界框回归,得到航拍图像数据的目标检测框,另一路使用两层全连接层处理后进行分类,得到航拍图像数据的目标分类结果。
[0012]可选地,在本专利技术的一个实施例中,所述感兴趣区域池化层中的池化方式为调制可变形感兴趣区域池化。
[0013]本专利技术第二方面实施例提供一种基于变换器和跳跃路径聚合FPN的航拍目标检测装置,包括:获取模块,用于获取待检测的航拍图像数据;
[0014]检测模块,用于将所述待检测的航拍图像数据输入预先训练好的航拍小目标检测网络模型进行目标检测,得到所述待检测的航拍图像数据的目标检测结果;其中,所述航拍小目标检测网络模型为利用可变形卷积和变换器模块结合的深度聚合残差变换网络进行特征提取,利用跳跃路径聚合特征金字塔网络进行特征融合,利用双路路解耦检测头进行目标检测。
[0015]可选地,在本专利技术的一个实施例中,所述航拍小目标检测网络模型包括骨干网络、颈部网络、区域提取网络、感兴趣区域池化层和检测头;
[0016]所述骨干网络包括一个起始处理层和四个阶段处理层,起始处理层由3个3x3卷积和一个最大池化层组成;每个阶段处理层由多个结合可变形卷积和变换器的聚合残差变换瓶颈层级联组成,通过所述四个阶段处理层输出航拍图像数据的四层特征图;
[0017]所述颈部网络包括所述跳跃路径聚合特征金字塔网络,用于从所述骨干网络获取所述四层特征图,并经过卷积模块降低通道后输入所述跳跃路径聚合特征金字塔网络,所述跳跃路径聚合特征金字塔网络的输出送入所述区域提取网络和所述感兴趣区域池化层;
[0018]所述区域提取网络用于生成候选区域;
[0019]所述感兴趣区域池化层用于利用所述区域提取网络生成的候选区域在所述跳跃路径聚合特征金字塔网络输出的特征图上进行感兴趣区域特征图提取,利用感兴趣区域池化使得所有特征图输出尺寸相同,并将特征图送入所述检测头;
[0020]所述检测头为级联RCNN多阶段结构,每个阶段使用双路解耦检测头,对于所述感兴趣区域池化层输出的特征图,一路使用四个卷积层处理后进行边界框回归,得到航拍图像数据的目标检测框,另一路使用两层全连接层处理后进行分类,得到航拍图像数据的目标分类结果。
[0021]可选地,在本专利技术的一个实施例中,所述感兴趣区域池化层中的池化方式为调制可变形感兴趣区域池化。
[0022]本专利技术第三方面实施例提供一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以执行如上述实施例所述的基于变换器和本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于变换器和跳跃路径聚合FPN的航拍目标检测方法,其特征在于,包括以下步骤:获取待检测的航拍图像数据;将所述待检测的航拍图像数据输入预先训练好的航拍小目标检测网络模型进行目标检测,得到所述待检测的航拍图像数据的目标检测结果;其中,所述航拍小目标检测网络模型为利用可变形卷积和变换器模块结合的深度聚合残差变换网络进行特征提取,利用跳跃路径聚合特征金字塔网络进行特征融合,利用双路路解耦检测头进行目标检测。2.根据权利要求1所述的方法,其特征在于,所述航拍小目标检测网络模型包括骨干网络、颈部网络、区域提取网络、感兴趣区域池化层和检测头;所述骨干网络包括一个起始处理层和四个阶段处理层,起始处理层由3个3x3卷积和一个最大池化层组成;每个阶段处理层由多个结合可变形卷积和变换器的聚合残差变换瓶颈层级联组成,通过所述四个阶段处理层输出航拍图像数据的四层特征图;所述颈部网络包括所述跳跃路径聚合特征金字塔网络,用于从所述骨干网络获取所述四层特征图,并经过卷积模块降低通道后输入所述跳跃路径聚合特征金字塔网络,所述跳跃路径聚合特征金字塔网络的输出送入所述区域提取网络和所述感兴趣区域池化层;所述区域提取网络用于生成候选区域;所述感兴趣区域池化层用于利用所述区域提取网络生成的候选区域在所述跳跃路径聚合特征金字塔网络输出的特征图上进行感兴趣区域特征图提取,利用感兴趣区域池化使得所有特征图输出尺寸相同,并将特征图送入所述检测头;所述检测头为级联RCNN多阶段结构,每个阶段使用双路解耦检测头,对于所述感兴趣区域池化层输出的特征图,一路使用四个卷积层处理后进行边界框回归,得到航拍图像数据的目标检测框,另一路使用两层全连接层处理后进行分类,得到航拍图像数据的目标分类结果。3.根据权利要求2所述的方法,其特征在于,所述感兴趣区域池化层中的池化方式为调制可变形感兴趣区域池化。4.一种基于变换器和跳跃路径聚合FPN的航拍目标检测装置,其特征在于,包括:获取模块,用于获取待检测的航拍图像数据;检测模块,用于将所述待检测的航拍图像数据输入预先训练好的航拍小目标检测网络模型进行目标检测,得到所述待检测的航拍图像数据的目标检...

【专利技术属性】
技术研发人员:杨绿溪郑志刚谢昂张翅王潇祎徐琴珍俞菲
申请(专利权)人:东南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1