基于高分辨率特征自注意的卫星遥感图像小目标检测方法技术

技术编号:39421539 阅读:12 留言:0更新日期:2023-11-19 16:10
本发明专利技术涉及一种基于高分辨率特征自注意的卫星遥感图像小目标检测方法,该方法包括以下步骤:获取数据集,并将数据集进行Mosaic数据增强;将增强后的数据送入网络中进行训练;构建网络;优化算法采用随机梯度下降算法SGD作为优化器;训练模型后对图片进行预测,得到结果。本发明专利技术通过一种高分辨率特征融合网络来保持小目标在前向传递中的特征,使得自注意力的全局信息编码能力和空间注意力机制对局部特征加强的能力相互弥补,再通过一种平行检测结构将卷积层得到的检测信息与混合注意力得到的注意力信息进行结合,进而减轻复杂背景信息对小目标的干扰。本发明专利技术相对于现有遥感小目标检测方法能够更好的排除图像中的干扰背景,实现高准确率小目标检测。实现高准确率小目标检测。实现高准确率小目标检测。

【技术实现步骤摘要】
基于高分辨率特征自注意的卫星遥感图像小目标检测方法


[0001]本专利技术涉及卫星遥感图像目标检测
,特别涉及一种基于高分辨率特征自注意的卫星遥感图像小目标检测方法。

技术介绍

[0002]目前,面向卫星遥感场景的目标检测技术已展开一定研究,该技术可广泛应用于军事目标识别、交通管理和环境监测等任务中。然而,在遥感场景下实现精准的目标检测是一个挑战性问题:一方面,在许多遥感图像中,目标仅仅是几个像素大小的低分辨率目标;另一方面,较小的目标会与复杂背景产生混淆,对检测产生干扰,进一步增加了小目标检测的难度。
[0003]作为图像处理领域的主流方法,深度学习技术在遥感图像处理领域扮演了重要的角色,近年来,面向通用场景的目标检测方法已经实现了很大的突破,如Faster R

CNN、SSD、YOLO等多种卷积神经网络被相继提出。然而,由于遥感图像具有数据量大、信息丰富和图像复杂的特点,直接将这些算法应用于遥感目标检测任务很难得到令人满意的效果,尤其在面对极小目标时会带来很大挑战。通用场景检测方法中被广泛研究的CNN类方法虽然在空间位置表示能力上具有较好的性能,但很难对全局空间和上下文信息进行建模。
[0004]Kim等人在论文《ECAP

YOLO:Efficient Channel Attention Pyramid YOLO for Small Object Detection in Aerial Image》中,基于YOLOv5提出了一种高效通道注意力金字塔模块,通过对特征图的通道维度进行权重分布,提高小目标在通道维度的特征显著性,但没有获取特征图全局相关性的能力。Hu等人在论文《PAG

YOLO:A Portable Attention

Guided YOLO Network for Small Ship Detection》中提出了一种通道和空间维度的注意力机制,能够引导模型优化小目标的特征信息表示,并与YOLOv5结合,实现快速准确的目标识别,与Kim等人的论文类似,同样采用注意力机制提升特征有效性,但存在相同的问题。Zhang等人在论文《Multi

Stage Feature Enhancement Pyramid Network for Detecting Objects in Optical Remote Sensing Images》中提出了多层级特征增强金字塔网络,在特征融合中利用输入多级特征进行融合,增强特征显示度,解决模糊目标识别问题,但在面对极小目标时,缺乏图像中的细节信息,导致识别效果较差。
[0005]随着遥感成像方式的不断进步,卫星遥感图像小目标检测已发展为计算机视觉领域重要研究方向之一。但在超远距离卫星观测过程中,图像背景信息复杂度高,目标仅仅是几个像素大小的低分辨率目标。针对这些问题,现有的采用注意力机制的方法仅仅能提取出局部图像信息,缺少了全局的信息处理方式;而图像细节对小目标检测十分重要,现有方法不能够实现高分辨率的特征图前向传递。

技术实现思路

[0006]本专利技术要解决现有技术中的技术问题,提供一种基于高分辨率特征自注意的卫星遥感图像小目标检测方法。
[0007]为了解决上述技术问题,本专利技术的技术方案具体如下:
[0008]一种基于高分辨率特征自注意的卫星遥感图像小目标检测方法,该方法适用的系统包括:骨干网络、高分辨率特征融合网络、主检测结构、辅助检测结构和预测头;
[0009]所述骨干网络用来将输入图像通过卷积操作,将图片下采样,减小图片的空间分辨率;
[0010]所述高分辨率特征网络包括:基本模块、融合模块和通道注意力空间金字塔模块;
[0011]所述主检测结构由C3模块组成,包含三个卷积模块和一个瓶颈结构;所述卷积模块包含批归一化、Relu激活函数和卷积操作;所述瓶颈结构由三个串联的卷积模块构成,其中第二个卷积模块输出的通道数是输入的一半;在C3模块中,一条支路经过第一个卷积模块和瓶颈模块,另一条经过第二个卷积模块,将两个支路结果进行拼接操作并经过第三个卷积模块;
[0012]所述辅助检测结构包括:混合注意力模块和自注意力模块;
[0013]所述预测头用来将输入特征图经过非极大值抑制处理后得到预测结果;
[0014]该方法包括以下步骤:
[0015](1)获取数据集,并将数据集进行Mosaic数据增强;将增强后的数据送入网络中进行训练;
[0016](2)构建网络,包含:骨干网络、高分辨率特征融合网络、主检测结构、辅助检测结构和预测头;
[0017](3)优化算法采用随机梯度下降算法SGD作为优化器,以16张图片作为一个训练批次,模型初始学习率为1e

2,权重衰减参数为5e

4,且动量为0.937,训练300个epoch;在模型训练的初始阶段,采用3个epoch进行热身训练;
[0018](4)训练模型后对图片进行预测,得到结果。
[0019]在上述技术方案中,所述高分辨率特征网络划分为三个阶段:
[0020]在第一阶段中,网络特征图的通道数为256;
[0021]在第二阶段中,存在的网络通道数为256和512;
[0022]在第三阶段中,存在的网络通道数为256、512和1024;
[0023]第一阶段中的通道数为256的输入特征图和第二阶段中的通道数为512的输入特征图,采用残差连接与第三阶段中的输出特征图进行通道维度拼接。
[0024]在上述技术方案中,在所述高分辨率特征融合网络中:
[0025]所述基本模块的输入特征图为输入的特征图将经过两次带有批归一化和Relu激活函数的卷积操作,之后与输入特征图按照对应位元素相加,最终得到输出特征图其计算过程如下:
[0026]X
out
=X
in
+f2(f1(X
in
))
[0027]其中,f(
·
)表示带有批归一化和Relu激活函数的卷积层;
[0028]所述融合模块输入的特征图会经过叠加操作后,通过带有批归一化和Relu激活函数的卷积操作;
[0029]所述通道注意力空间金字塔模块包括:通道注意力机制模块和特征金字塔模块;
[0030]在所述通道注意力机制模块中,首先,输入的特征图为之后经过通
道维度的平均池化得到特征图随后经过Sigmoid激活函数得到特征图最终输入I与输出P按照元素相乘,得到ECA模块的输出
[0031]在所述特征金字塔模块中,ECA的输出将作为SPP模块的输入,输入后,将通过三个带有不同卷积核的最大平均池化操作,卷积核的大小分别为5*5,9*9,13*13;随后,三个池化后的特征图会与SPP部分的输入Z相拼接,最后再经过一个带有批归一化和Relu激活函数的卷积,得到输出的特征图为其计算本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于高分辨率特征自注意的卫星遥感图像小目标检测方法,其特征在于,该方法适用的系统包括:骨干网络、高分辨率特征融合网络、主检测结构、辅助检测结构和预测头;所述骨干网络用来将输入图像通过卷积操作,将图片下采样,减小图片的空间分辨率;所述高分辨率特征网络包括:基本模块、融合模块和通道注意力空间金字塔模块;所述主检测结构由C3模块组成,包含三个卷积模块和一个瓶颈结构;所述卷积模块包含批归一化、Relu激活函数和卷积操作;所述瓶颈结构由三个串联的卷积模块构成,其中第二个卷积模块输出的通道数是输入的一半;在C3模块中,一条支路经过第一个卷积模块和瓶颈模块,另一条经过第二个卷积模块,将两个支路结果进行拼接操作并经过第三个卷积模块;所述辅助检测结构包括:混合注意力模块和自注意力模块;所述预测头用来将输入特征图经过非极大值抑制处理后得到预测结果;该方法包括以下步骤:(1)获取数据集,并将数据集进行Mosaic数据增强;将增强后的数据送入网络中进行训练;(2)构建网络,包含:骨干网络、高分辨率特征融合网络、主检测结构、辅助检测结构和预测头;(3)优化算法采用随机梯度下降算法SGD作为优化器,以16张图片作为一个训练批次,模型初始学习率为1e

2,权重衰减参数为5e

4,且动量为0.937,训练300个epoch;在模型训练的初始阶段,采用3个epoch进行热身训练;(4)训练模型后对图片进行预测,得到结果。2.根据权利要求1所述的基于高分辨率特征自注意的卫星遥感图像小目标检测方法,其特征在于,所述高分辨率特征网络划分为三个阶段:在第一阶段中,网络特征图的通道数为256;在第二阶段中,存在的网络通道数为256和512;在第三阶段中,存在的网络通道数为256、512和1024;第一阶段中的通道数为256的输入特征图和第二阶段中的通道数为512的输入特征图,采用残差连接与第三阶段中的输出特征图进行通道维度拼接。3.根据权利要求1所述的基于高分辨率特征自注意的卫星遥感图像小目标检测方法,其特征在于,在所述高分辨率特征融合网络中:所述基本模块的输入特征图为输入的特征图将经过两次带有批归一化和Relu激活函数的卷积操作,之后与输入特征图按照对应位元素相加,最终得到输出特征图其计算过程如下:X
out
=X
in
+f2(f1(X
in
))其中,f(
·
)表示带有批归一化和Relu激活函数的卷积层;所述融合模块输入的特征图会经过叠加操作后,通过带有批归一化和Relu激活函数的卷积操作;所述通道注意力空间金字塔模块包括:通道注意力机制模块和特征金字塔模块;
在所述通道注意力机制模块中,首先,输入的特征图为之后经过通道维度的平均池化得到特征图随后经过Sigmoid激活函数得到特征图最终输入I与输出P按照元素相乘,得到ECA模块...

【专利技术属性】
技术研发人员:刘巧元张笑闻孙海江
申请(专利权)人:中国科学院长春光学精密机械与物理研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1