基于多重自适应机制的遥感图像飞机检测方法技术

技术编号：40914042 阅读：2 留言：0更新日期：2024-04-18 14:41

本发明专利技术提出了一种基于多重自适应机制的遥感图像飞机检测方法，步骤如下：对遥感数据集中的图像进行预处理，将预处理后的图像分成训练集和测试集；构建目标检测模型：在YOLOX的特征提取主干网络加入感受野自适应空间金字塔池化模块，在多尺度特征金字塔部分中加入自适应卷积多尺度注意特征融合模块；将原来的IoU损失函数替换为Mittag Leffler损失函数，将训练集中图像送入目标检测模型进行训练，得到模型权重参数；将测试集中图像送入目标检测模型并加载训练得到的模型权重参数，以进行性能测试并分析实验结果。本发明专利技术能够提高对遥感图像中飞机的检测精度，解决了低质量样本、真实框和预测框之间的几何因素对模型的影响，且加速了模型的收敛过程。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于计算机视觉和深度学习的，尤其涉及一种基于多重自适应机制的遥感图像飞机检测方法。

技术介绍

1、随着遥感技术的不断发展，在农业、林业、水利和地球科学研究等各个领域中扮演着重要角色，然而在进行遥感图像中的飞机检测任务时，仍存在小目标、强干扰和部分遮挡等问题，这些问题严重影响飞机检测的准确性。因此，提高遥感图像中飞机检测的能力变得非常迫切。

2、注意力机制的思想源于人类在选择性地关注相关信息并忽略无关信息的方式。它的主要作用是通过引导注意力到最重要的信息区域来改善模型的学习能力。在计算机视觉中，注意机制主要包括空间注意力、通道注意力和混合域注意力三种类型。空间注意力通过计算特征图中每个位置与其他位置之间的相关性，从而得出注意力权重。通道注意力一般使用全局平均池化来获取每个通道的特征信息，然后使用两个全连接层来学习每个通道的权重，并将加权特征图作为下一层网络的输入。而混合域注意力结合了通道注意力和空间注意力的优点，根据不同的任务需求进一步提升了特征表示的能力。

3、在目标检测中，回归损失函数被广泛应用于衡量预测值与真实值之间的差异。回归损失函数的目标是缩小预测框与真实框之间的距离，从而提高目标检测的准确性。常见的回归损失函数包括平滑l1损失和iou损失。平滑l1损失通过计算预测框与真实框之间的差异，并使用平滑函数来减少异常值的影响。平滑l1损失在目标检测中广泛使用，能够平衡边界框的位置和尺寸的误差。另一种常见的回归损失函数是iou损失函数，通过计算预测框与真实框之间的交并比，来度量它们的重叠程度。除

4、申请号为202310621328.4的专利技术专利提出了一种改进yolov5的遥感图像飞机目标检测方法，包括以下步骤：对飞机图像检测数据集进行数据清洗和分层标注处理；将所述飞机图像检测数据集输入到训练好的改进yolov5的遥感图像飞机目标检测模型，使用特征提取模块对所述飞机图像检测数据集进行特征提取得到多个尺度的特征图，以满足多个尺度的目标检测需求；使用bi-fpn架构的特征融合模块对多个尺度的所述特征图进行不同层次语义信息传递融合，得到多个尺度的特征解码；使用检测头在多个尺度上进行目标检测，并对不同尺度的所述特征解码进行解析操作，得到解析后的预测框边缘坐标，并输出目标所对应类别的多个尺度的检测结果；根据所述检测结果在飞机图像检测数据集中的原图像进行标定，选出目标位置，并得到类别置信度。上述专利技术可应用于各种复杂的场景，通过构建数据集、改进数据增强策略、优化模型结构和参数等方式，能够有效提高飞机目标检测的准确率和鲁棒性，具有重大的经济效益和社会效益，并对其他遥感影像自动化判读系统具有一定的促进作用。然而，上述专利技术中的特征提取模块采用的空间金字塔池化层将不同尺度的特征进行池化后直接拼接在一起，进而导致信息的损失；此外，在使用bi-fpn架构的特征融合模块时，通过上采样和下采样操作后将不同尺度的特征直接相加，会影响对小目标的检测能力；最后，在检测头部分，上述专利技术采用的是iou损失函数来衡量边界框之间的相似性，但在遥感图像中存在一些相对较小的目标，使用iou损失函数会导致真实框与预测框不相交，进而使iou值为0，无法进行优化模型。

技术实现思路

1、针对复杂场景区域或飞机密集区域内的小尺度目标检测精度较低的技术问题，本专利技术提出一种基于多重自适应机制的遥感图像飞机检测方法，能够快速准确的检测出飞机目标。

2、为了达到上述目的，本专利技术的技术方案是这样实现的：一种基于多重自适应机制的遥感图像飞机检测方法，其步骤如下：

3、步骤一：对rsod遥感数据集中的图像进行预处理，将预处理后的图像分成训练集和测试集；

4、步骤二：构建目标检测模型：在yolox的特征提取主干网络中加入感受野自适应空间金字塔池化模块，在多尺度特征金字塔部分中加入自适应卷积多尺度注意特征融合模块；

5、步骤三：将原来的iou损失函数替换为mittag leffler损失函数，将训练集中图像送入目标检测模型进行训练，得到模型权重参数；

6、步骤四：将测试集中图像送入目标检测模型并加载训练得到的模型权重参数，以进行性能测试并分析实验结果。

7、优选地，所述预处理包括数据增强，数据增强利用随机裁剪、旋转和添加噪声实现；按照9:1的比例划分为训练集和测试集。

8、优选地，所述特征提取主干网络对输入的图片进行特征提取，得到三个不同深度的特征图p1、p2和r1；对特征图r1通过感受野自适应空间金字塔池化模块进行不同池化核的最大池化，从而获得不同感受野的特征图p3；将特征图p1、特征图p2和特征图p3共同输入到多尺度特征金字塔部分中，利用自适应卷积多尺度注意特征融合模块进行充分融合，以减少信息丢失。

9、优选地，所述感受野自适应空间金字塔池化模块设置在特征提取主干网络的最上方，通过动态选择合适的池化核进行空间金字塔最大池化，从而获得丰富的上下文信息。

10、优选地，所述感受野自适应空间金字塔池化模块将特征提取主干网络提取的特征信息fin作为输入，通过卷积、归一化和silu激活函数得到原始特征图，再利用不同核大小的最大池化操作，提取出图像的局部信息和全局信息；通过感受野自适应操作计算得到每个输入特征的权重，将权重与经过不同池化核的最大池化所提取的特征图相乘生成三个具有不同感受野的特征图；将三个不同感受野的特征图与原始特征图进行相加得到合成特征图；再次应用卷积层、归一化和silu激活函数，得到最终输出的特征图。

11、优选地，所述最大池化操作中不同核大小分别为5×5、9×9、13×13；

12、所述感受野自适应操作计算为：

13、

14、其中，αi表示可学习的参数，αj表示通过relu激活函数处理后的可学习参数，e表示为了防止分母为0的常数，j表示最大池化操作的池化核大小，i表示5、9和13；

15、所述感受野自适应空间金字塔池化模块最终输出的特征图为：

16、

17、其中，w(j)表示经过感受野自适应操作得到的权重，j表示最大池化操作的池化核大小，分别为5、9和13，conv2d是二维卷积，maxpoolj是不同池化核的最大池化操作，b是归一化操作，σ是silu激活函数，fin表示输入特征图，fout表示输出特征图。

18、优选地，所述自适应卷积多尺度注意特征融合模块利用自适应卷积多尺度通道注意模块有效缓解目标检测模型在多层次特征融合过程中出现的语义丢失和信息混淆问题；

19、所述自适应卷积多尺度注意特征融合模块的具体操作为：

20、本文档来自技高网...

【技术保护点】

1.一种基于多重自适应机制的遥感图像飞机检测方法，其特征在于，其步骤如下：

2.根据权利要求1所述的一种基于多重自适应机制的遥感图像飞机检测方法，其特征在于，所述预处理包括数据增强，数据增强利用随机裁剪、旋转和添加噪声实现；按照9:1的比例划分为训练集和测试集。

3.根据权利要求1或2所述的一种基于多重自适应机制的遥感图像飞机检测方法，其特征在于，所述特征提取主干网络对输入的图片进行特征提取，得到三个不同深度的特征图P1、P2和R1；对特征图R1通过感受野自适应空间金字塔池化模块进行不同池化核的最大池化，从而获得不同感受野的特征图P3；将特征图P1、特征图P2和特征图P3共同输入到多尺度特征金字塔部分中，利用自适应卷积多尺度注意特征融合模块进行充分融合，以减少信息丢失。

4.根据权利要求3所述的一种基于多重自适应机制的遥感图像飞机检测方法，其特征在于，所述感受野自适应空间金字塔池化模块设置在特征提取主干网络的最上方，通过动态选择合适的池化核进行空间金字塔最大池化，从而获得丰富的上下文信息。

5.根据权利要求4所述的一种基于多重自适应

6.根据权利要求5所述的一种基于多重自适应机制的遥感图像飞机检测方法，其特征在于，所述最大池化操作中不同核大小分别为5×5、9×9、13×13；

7.根据权利要求4-6中任意一项所述的一种基于多重自适应机制的遥感图像飞机检测方法，其特征在于，所述自适应卷积多尺度注意特征融合模块利用自适应卷积多尺度通道注意模块有效缓解目标检测模型在多层次特征融合过程中出现的语义丢失和信息混淆问题；

8.根据权利要求7所述的一种基于多重自适应机制的遥感图像飞机检测方法，其特征在于，所述卷积核k的表达式为：

9.根据权利要求1或8中任意一项所述的一种基于多重自适应机制的遥感图像飞机检测方法，其特征在于，所述Mittag Leffler损失函数为：

10.根据权利要求1、4-6、8任一项所述的一种基于多重自适应机制的遥感图像飞机检测方法，其特征在于，将多尺度特征金字塔部分输出的3个特征图输入到检测头部分进行分类和回归，得到检测结果；

...

【技术特征摘要】

1.一种基于多重自适应机制的遥感图像飞机检测方法，其特征在于，其步骤如下：

3.根据权利要求1或2所述的一种基于多重自适应机制的遥感图像飞机检测方法，其特征在于，所述特征提取主干网络对输入的图片进行特征提取，得到三个不同深度的特征图p1、p2和r1；对特征图r1通过感受野自适应空间金字塔池化模块进行不同池化核的最大池化，从而获得不同感受野的特征图p3；将特征图p1、特征图p2和特征图p3共同输入到多尺度特征金字塔部分中，利用自适应卷积多尺度注意特征融合模块进行充分融合，以减少信息丢失。

5.根据权利要求4所述的一种基于多重自适应机制的遥感图像飞机检测方法，其特征在于，所述感受野自适应空间金字塔池化模块将特征提取主干网络提取的特征信息fin作为输入，通过卷积、归一化和silu激活函数得到原始特征图，再利用不同核大小的...

【专利技术属性】
技术研发人员：王凤仙，李岱霖，张杰，李林伟，王鑫，张焕龙，王延峰，陈宜滨，史坤峰，
申请(专利权)人：郑州轻工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人