当前位置: 首页 > 专利查询>中原电子技术研究所中国电子科技集团公司第二十七研究所专利>正文

用于高分辨率遥感影像的密集旋转目标检测方法技术

技术编号：41210170 阅读：4 留言：0更新日期：2024-05-09 23:32

本发明专利技术公开了一种用于高分辨率遥感影像的密集旋转目标检测方法，包括如下步骤：构建密集旋转目标检测网络，利用双重注意力机制模块完成对待检测目标信息进行初步提取与筛选；基于门控多尺度特征自适应融合模块，对步骤中的四个特征图进行自适应适合；基于解耦头对步骤中得到的特征图进行预测，得出分类结果。本发明专利技术通过使用双重注意力机制模块进行目标信息的提取和筛选，提升特征提取网络对于不同级别信息的获取与建模能力，减少图像中待检测对象分布密度变化引起的漏检与错检，在不额外增加参数的情况下，过滤多尺度特征中的无用信息并保留关键信息，进而可以显著增强特征融合的效率与信息利用率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及遥感图像检测，尤其涉及用于高分辨率遥感影像的密集旋转目标检测方法。

技术介绍

1、目前，高分辨率遥感图像具有覆盖范围广、纹理特征丰富、单位面积信息利用率高的特点。单景高分辨遥感影像通常包含许多待检测对象，当这些对象密集排列时，由于卫星传感器拍摄姿态与天气等因素的影响，相邻对象间的边缘会难以分辨，在视觉上呈现模糊效果，增加了准确识别对象边界的难度。在现有目标检测算法中，对于目标的识别模型通常是基于卷积神经网络构建特征分层特征提取结构[1]。分层特征提取结构可以生成包含待检测目标信息的不同尺度特征，其中大尺度特征包含对象边界、顶点和纹理等信息，而小尺度特征包含更多的隐含抽象信息[2]。层级特征结构中目标隐含信息的提取是基于共享权重卷积核实现的，但共享卷积核的感受野有限，容易忽略整体和部分之间的关系，不利于把握上下文特征[3]。一些学者通过增加网络深度或增加连接结构来削弱上述问题的影响，但过于复杂的网络可能具有冗余参数，会增加模型训练的难度[4]。不同尺度特征结构可以使网络具有高效的表示能力，但由于不同尺度特征图之间的尺度差异，难以直接利用这些特征信息，一些学者使用单向或双向特征金字塔融合多尺度层次特征[5][6]。然而，由于特征金字塔的计算量大、复杂度高，在提高精度的同时，会大大降低网络检测速度。因此，有必要针对性地优化目标检测模型在高分辨率遥感图像密集场景中的应用效果，平衡模型精度和网络的复杂性。

2、[1]袁翔,程塨,李戈等.遥感影像小目标检测研究进展[j].中国图象图形学报,2023,28(06):1662-1684.

3、[2]王彦雅.基于深度学习的遥感图像目标检测算法研究[d].河北经贸大学,2023.doi:10.27106/d.cnki.ghbju.2023.000195.

4、[3]万方.复杂背景遥感图像多目标检测算法改进研究[d].宁夏大学,2022.doi:10.27257/d.cnki.gnxhc.2022.001581.

5、[4]汪西莉,梁正印,刘涛.基于特征注意力金字塔的遥感图像目标检测方法[j].遥感学报,2023,27(02):492-501.

6、[5]徐成琪,洪学海.基于功能保持的特征金字塔目标检测网络[j].模式识别与人工智能,2020,33(06):507-517.doi:10.16451/j.cnki.issn1003-6059.202006004.

7、[6]刘东东,马银平.融合上下文特征和空洞空间金字塔池化的语义分割[j].现代计算机,2022,28(11):41-45。

8、综上现有的方法中并不能满足实际的精度和复杂度平衡的需求。

技术实现思路

1、本专利技术的目的是提供用于高分辨率遥感影像的密集旋转目标检测方法，能够该算法通过双重注意力机制模块和门控多尺度特征自适应融合模块进行优化，可以准确地提取高分辨率遥感图像密集场景中的目标，且整体结构相对不复杂。

2、本专利技术采用的技术方案为：

3、用于高分辨率遥感影像的密集旋转目标检测方法，包括如下步骤：

4、步骤1：构建密集旋转目标检测网络，利用双重注意力机制模块完成对待检测目标信息进行初步提取与筛选，并生成四个尺度依次递减的特征图用于特征融合；

5、步骤2：基于门控多尺度特征自适应融合模块，对步骤一中的四个特征图进行自适应适合，使得每个尺度特征图均包含有其他三个尺度特征图信息，得到用于检测头预测的特征图；

6、步骤3：基于解耦头对步骤二中得到的特征图进行预测，得出分类结果。

7、所述的双重注意力机制模块分为两部分，左半部分为窗口多头自注意力模块wmsa，右半部分为空间注意力模块sa。

8、所述的窗口多头自注意力模块的表达式为：

9、wmsa＝concat(headi)w (1)

10、

11、在公式中，q、k和v分别是查询矩阵、键矩阵和值矩阵，均由图像向量组成；b表示由窗口滑动创建的相对位置偏移矩阵；dk表示神经网络中隐藏单元的数量，主要起到防止内积维数过大的调节作用；w表示用于线性映射的参数矩阵，而concat表示按图像维度进行串联操作；softmax为激活函数用于增加网络的非线性表达能力，注意头的个数在本实施例中由i表示，i＝8；q、k和v的计算公式如下所示：

12、

13、在公式中，f是输入特征图，inchannel表示输入特征图的维度；以qi为例，其尺寸大小为[bq，head，windowsize，cq/head]，其中head＝8，windowsize＝4，其他参数计算如下；

14、

15、cq＝inchannel//heads (5)

16、公式中，h和w分别表示特征图的高度和宽度，inchannel表示特征图尺寸,linear为线性激活函数，用于增强网络线性表达能力；batchsize表示同一批次输入网络运行的图像数量；heads表示窗口多头自注意力模块中注意头的个数；//表示整除；

17、wmsa的输出需要输入mlp模块进行非线性映射；mlp模块的输出需要与未通过wmsa的特征保持残差连接，以便特征尺寸保持不变；

18、

19、

20、在公式中，fa表示wmsa的输出，fd此处仅代表中间计算的过程结果参数，无特殊含义；in表示输入维度，out表示输出维度，其中out为in的四倍；gelu是一个非单调激活函数，用于保持网络梯度稳定性和增加非线性特征，而dropout用于避免网络过拟合和提高运行速度；在mlp之后，使用patchmerging来实现特征下采样和降维。

21、所述的步骤1中，为了增强了wmsa操作中窗口之间的信息交换，通过将空间注意力sa的输出与wmsa的输出连接起来，空间注意力sa的计算公式如下所示：

22、saf＝sigmoid(conv1([avgpool(f)；maxpool(f)])) (8)

23、在公式中，sigmoid是激活函数，conv1表示1×1卷积，avgpool表示平均池化，maxpool表示最大池化。

24、所述的步骤2中，具体的采用门控多尺度特征自适应融合模块高效简洁地从多尺度特征中聚合有用信息并消除无用信息，其中，门控多尺度特征自适应融合模块针对feather1基于阈值自适应地控制特征图之间的信息融合过程包括如下步骤：

25、首先，feature2、feature3、feature4分别进行降采样到尺度与feather1一致，并分别生成相对应gate图，gate图尺寸与feather1一致，取值范围为[0-1],之后gate图分别与降采样后的feature2、feature3、feature4相乘后求和得到异尺度下的聚合特征图；

26、其次，本文档来自技高网...

【技术保护点】

1.用于高分辨率遥感影像的密集旋转目标检测方法，其特征在于：包括如下步骤：

2.根据权利要求1所述的用于高分辨率遥感影像的密集旋转目标检测方法，其特征在于：所述的双重注意力机制模块分为两部分，左半部分为窗口多头自注意力模块WMSA，右半部分为空间注意力模块SA。

3.根据权利要求2所述的用于高分辨率遥感影像的密集旋转目标检测方法，其特征在于：所述的窗口多头自注意力模块的表达式为：

4.根据权利要求3所述的用于高分辨率遥感影像的密集旋转目标检测方法，其特征在于，所述的步骤1中，为了增强了WMSA操作中窗口之间的信息交换，通过将空间注意力SA的输出与WMSA的输出连接起来，空间注意力SA的计算公式如下所示：

5.根据权利要求3所述的用于高分辨率遥感影像的密集旋转目标检测方法，其特征在于：所述的步骤2中，具体的采用门控多尺度特征自适应融合模块高效简洁地从多尺度特征中聚合有用信息并消除无用信息，其中，门控多尺度特征自适应融合模块针对Feather1基于阈值自适应地控制特征图之间的信息融合过程包括如下步骤：

6.根据权利要求1所述

7.根据权利要求1所述的用于高分辨率遥感影像的密集旋转目标检测方法，其特征在于：所述的步骤3中，检测头中添加角度检测分支，并引入KLD-LOSS作为损失函数，优化模型预测结果，使算法具有更好的密集目标检测能力。

...

【技术特征摘要】

1.用于高分辨率遥感影像的密集旋转目标检测方法，其特征在于：包括如下步骤：

2.根据权利要求1所述的用于高分辨率遥感影像的密集旋转目标检测方法，其特征在于：所述的双重注意力机制模块分为两部分，左半部分为窗口多头自注意力模块wmsa，右半部分为空间注意力模块sa。

3.根据权利要求2所述的用于高分辨率遥感影像的密集旋转目标检测方法，其特征在于：所述的窗口多头自注意力模块的表达式为：

4.根据权利要求3所述的用于高分辨率遥感影像的密集旋转目标检测方法，其特征在于，所述的步骤1中，为了增强了wmsa操作中窗口之间的信息交换，通过将空间注意力sa的输出与wmsa的输出连接起来，空间注意力sa的计算公式如下所示：

5.根...

【专利技术属性】
技术研发人员：闫贺，张明，王玉玺，
申请(专利权)人：中原电子技术研究所中国电子科技集团公司第二十七研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人