当前位置: 首页 > 专利查询>东南大学专利>正文

基于注意力机制和自适应特征融合的航拍目标检测方法技术

技术编号:38382998 阅读:6 留言:0更新日期:2023-08-05 17:40
本发明专利技术公开了一种基于注意力机制和自适应特征融合的航拍目标检测方法,包括:获取待检测的航拍图像数据;将待检测的航拍图像数据输入预先训练的航拍小目标检测模型,得到待检测的航拍图像数据的目标检测结果,其中,航拍小目标检测模型为在YOLO算法框架中设置轻量级自适应特征融合模块和混洗坐标注意力层,并利用训练航拍图像数据及其对应的目标检测结果训练得到。本发明专利技术在航拍视角小目标检测上,能够达到更高的识别精度。对于无人机平台的航拍小目标检测,网络速度快精度搞,能够以较低参数和计算复杂度表现出更好的检测效果。参数和计算复杂度表现出更好的检测效果。参数和计算复杂度表现出更好的检测效果。

【技术实现步骤摘要】
基于注意力机制和自适应特征融合的航拍目标检测方法


[0001]本专利技术涉及目标检测
,特别涉及一种基于注意力机制和自适应特征融合的航拍目标检测方法。

技术介绍

[0002]近年来,随着无人机技术的飞速发展,无人机航拍图像目标检测在多个领域,如城市交通、精准农业和环境勘测等众多实际场景中得到了广泛应用。由于航拍图像目标检测具有丰富的应用价值,研究者们围绕其展开了大量研究工作。早期的研究主要集中在滑动窗口搜索和手动特征提取技术上,这通常需要大量的先验知识和复杂的公式推导。随着计算机视觉技术的迅速发展,基于深度学习算法的目标检测展示出更为优越的性能,逐渐成为了主流技术并被广泛应用。
[0003]基于深度学习方法的目标检测算法主要分为两类:(1)以R

CNN、Faster R

CNN等为代表的二阶段目标检测算法,它们在生成候选框的基础上再回归出目标区域,具有较高的检测精度;(2)以YOLO、SSD等为代表的一阶段目标检测算法,它们直接对目标的位置和类别进行预测,具有更快的检测速度。尽管基于深度学习的目标检测方法在各种实际场景中广泛应用,但由于无人机通常部署在大型场景中,这意味着在一幅图像中存在许多小且密集分布的物体,同时复杂多样的背景信息也容易对待检测目标产生干扰,通用目标检测算法很难取得理想的检测效果。
[0004]无人机航拍图像中的小目标仅占据图像的一小部分,从细粒度局部区域直接获取的信息非常有限。利用图像中的上下文信息可以建立小目标与其他目标或背景的联系,从而帮助网络进行检测推断。多尺度特征是提高小目标检测率的一种有效方法。尽管Faster R

CNN和YOLO等方法采用了单一尺度的特征图,但这限制了特征信息的表达。为了增强网络多尺度信息的表达能力,结合不同层级特征图的特点,学者们提出了经典的特征金字塔结构,采用自上而下的体系结构和横向连接,交互不同层级的特征信息。进一步地,路径聚合网络在FPN的基础上添加了额外的自下而上的连接,以更高效地传递浅层信息到高层,从而减少信息流通时的损耗。然而,尽管上述结构能够提升网络多尺度表达的能力,但在融合不同层级特征图时,它们直接通过元素加法进行操作,忽略了不同层级特征图对小目标的贡献。对于小物体而言,更需要浅层特征中的细粒度特征信息来辨别,平等融合深层特征可能会削弱浅层特征对小目标的学习能力。此外,由于不同特征图之间的细腻度不同,直接采用相加或通道维度拼接的方式进行融合,容易产生冗余信息和噪声信息,影响上下文信息的获取,干扰物体之间的关系表达。

技术实现思路

[0005]本专利技术提供一种基于注意力机制和自适应特征融合的航拍目标检测方法,有助于在大型场景中实现对无人机航拍小目标的高效准确检测,满足多领域实际应用的需求。
[0006]本专利技术第一方面实施例提供一种基于注意力机制和自适应特征融合的航拍目标
检测方法,包括以下步骤:获取待检测的航拍图像数据;将所述待检测的航拍图像数据输入预先训练的航拍小目标检测模型,得到所述待检测的航拍图像数据的目标检测结果,其中,所述航拍小目标检测模型为在YOLO算法框架中设置轻量级自适应特征融合模块和混洗坐标注意力层,并利用训练航拍图像数据及其对应的目标检测结果训练得到。
[0007]可选地,在本专利技术的一个实施例中,所述航拍小目标检测模型包括:骨干网络、颈部网络、轻量级自适应特征融合模块和检测头层;
[0008]其中,所述骨干网络包括:一个起始处理层和四个阶段处理层,起始处理层包含两个卷积模块,卷积模块由二维卷积、批归一化、sigmoid加权线性单元激活函数三个子模块组成,第一阶段处理层由一个轻量级高效层聚合网络块和混洗坐标注意力层级联组成,第二阶段处理层、第三阶段处理层和第四阶段处理层均由一个最大池化层、轻量级高效层聚合网络块和混洗坐标注意力层级联组成,通过所述四个阶段处理层输出航拍图像数据的四层特征图;
[0009]所述颈部网络包括路径聚合特征金字塔网络,用于从所述骨干网络获取所述四层特征图,第一阶段处理层、第二阶段处理层和第三阶段处理层输出的特征图经过卷积模块降低通道后输入所述路径聚合特征金字塔网络,第四阶段处理层输出的特征图经过轻量级快速空间金字塔池化跨阶段局部网络模块降低通道后送入所述路径聚合特征金字塔网络,以利用所述路径聚合特征金字塔网络进行特征融合;
[0010]所述轻量级自适应特征融合模块设置在所述颈部网络的输出端,所述轻量级自适应特征融合模块由通过切片操作来下采样特征图大小并进行通道拼接以增加通道的扩张模块、融合通道信息以缩减通道的融合模块、内容感知的特征重组上采样模块和软池化模块,所述轻量级自适应特征融合模块用于通过对所述路径聚合特征金字塔网络输出的四层特征图进行自适应特征融合,并将特征图送入所述检测头层;
[0011]所述检测头层包括多个检测头,每个检测头由加性隐式模块、卷积模块和乘性隐式模块组成,检测头的损失函数包括定位损失,分类损失和置信度损失。
[0012]可选地,在本专利技术的一个实施例中,所述定位损失采用SIOU损失函数,所述置信度损失采用变焦损失函数。
[0013]可选地,在本专利技术的一个实施例中,所述路径聚合网络中的上采样层为内容感知的特征重组上采样层。
[0014]本专利技术第二方面实施例提供一种基于注意力机制和自适应特征融合的航拍目标检测装置,包括:获取模块,用于获取待检测的航拍图像数据;检测模块,用于将所述待检测的航拍图像数据输入预先训练的航拍小目标检测模型,得到所述待检测的航拍图像数据的目标检测结果,其中,所述航拍小目标检测模型为在YOLO算法框架中设置轻量级自适应特征融合模块和混洗坐标注意力层,并利用训练航拍图像数据及其对应的目标检测结果训练得到。
[0015]可选地,在本专利技术的一个实施例中,所述航拍小目标检测模型包括:骨干网络、颈部网络、轻量级自适应特征融合模块和检测头层;
[0016]其中,所述骨干网络包括:一个起始处理层和四个阶段处理层,起始处理层包含两个卷积模块,卷积模块由二维卷积、批归一化、sigmoid加权线性单元激活函数三个子模块组成,第一阶段处理层由一个轻量级高效层聚合网络块和混洗坐标注意力层级联组成,第
二阶段处理层、第三阶段处理层和第四阶段处理层均由一个最大池化层、轻量级高效层聚合网络块和混洗坐标注意力层级联组成,通过所述四个阶段处理层输出航拍图像数据的四层特征图;
[0017]所述颈部网络包括路径聚合特征金字塔网络,用于从所述骨干网络获取所述四层特征图,第一阶段处理层、第二阶段处理层和第三阶段处理层输出的特征图经过卷积模块降低通道后输入所述路径聚合特征金字塔网络,第四阶段处理层输出的特征图经过轻量级快速空间金字塔池化跨阶段局部网络模块降低通道后送入所述路径聚合特征金字塔网络,以利用所述路径聚合特征金字塔网络进行特征融合;
[0018]所述轻量级自适应特征融合模块设置在所述颈部网络的输出端,所述轻量级自适应特征融合模块由本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于注意力机制和自适应特征融合的航拍目标检测方法,其特征在于,包括以下步骤:获取待检测的航拍图像数据;将所述待检测的航拍图像数据输入预先训练的航拍小目标检测模型,得到所述待检测的航拍图像数据的目标检测结果,其中,所述航拍小目标检测模型为在YOLO算法框架中设置轻量级自适应特征融合模块和混洗坐标注意力层,并利用训练航拍图像数据及其对应的目标检测结果训练得到。2.根据权利要求1所述的方法,其特征在于,所述航拍小目标检测模型包括:骨干网络、颈部网络、轻量级自适应特征融合模块和检测头层;其中,所述骨干网络包括:一个起始处理层和四个阶段处理层,起始处理层包含两个卷积模块,卷积模块由二维卷积、批归一化、sigmoid加权线性单元激活函数三个子模块组成,第一阶段处理层由一个轻量级高效层聚合网络块和混洗坐标注意力层级联组成,第二阶段处理层、第三阶段处理层和第四阶段处理层均由一个最大池化层、轻量级高效层聚合网络块和混洗坐标注意力层级联组成,通过所述四个阶段处理层输出航拍图像数据的四层特征图;所述颈部网络包括路径聚合特征金字塔网络,用于从所述骨干网络获取所述四层特征图,第一阶段处理层、第二阶段处理层和第三阶段处理层输出的特征图经过卷积模块降低通道后输入所述路径聚合特征金字塔网络,第四阶段处理层输出的特征图经过轻量级快速空间金字塔池化跨阶段局部网络模块降低通道后送入所述路径聚合特征金字塔网络,以利用所述路径聚合特征金字塔网络进行特征融合;所述轻量级自适应特征融合模块设置在所述颈部网络的输出端,所述轻量级自适应特征融合模块由通过切片操作来下采样特征图大小并进行通道拼接以增加通道的扩张模块、融合通道信息以缩减通道的融合模块、内容感知的特征重组上采样模块和软池化模块,所述轻量级自适应特征融合模块用于通过对所述路径聚合特征金字塔网络输出的四层特征图进行自适应特征融合,并将特征图送入所述检测头层;所述检测头层包括多个检测头,每个检测头由加性隐式模块、卷积模块和乘性隐式模块组成,检测头的损失函数包括定位损失,分类损失和置信度损失。3.根据权利要求2所述的方法,其特征在于,所述定位损失采用SIOU损失函数,所述置信度损失采用变焦损失函数。4.根据权利要求2所述的方法,其特征在于,所述路径聚合网络中的上采样层为内容感知的特征重组上采样层。5.一种基于注意力机制和自适应特征融合的航拍目标检测装置,其特征在于,包括:获取模块,用于获取待检测的航拍图像数据;检测模块,用于将所述待检测的航拍图像数据输入预先训练的航拍小目标检测模型,得到所述待检测的航拍图像数据的目标检测结果,其中,所述...

【专利技术属性】
技术研发人员:杨绿溪郑志刚谢昂王潇祎张亚中李春国黄永明
申请(专利权)人:东南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1