System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于深度学习的遥感卫星影像目标检测方法技术_技高网
当前位置: 首页 > 专利查询>吉林大学专利>正文

一种基于深度学习的遥感卫星影像目标检测方法技术

技术编号:40214655 阅读:7 留言:0更新日期:2024-02-02 22:23
本发明专利技术公开了一种基于深度学习的遥感卫星影像目标检测方法,其方法为:第一步:获取图像样本,构建训练集;第二步:遥感卫星影像目标检测模型的构建;第三步:将待检测的图像,利用上述第二步得到的遥感卫星影像目标检测模型实现目标检测,有益效果:采用结合降通道的SPPF代替原先网络模型中的SPPCSP结构,不仅压缩了网络模型,减少了计算量,并且能更有效扩大感受野。此外在浅层ELAN模块中结合空间通道注意力(Convolutional Block Attention Module,CBAM)机制,弥补因池化下采样所造成的部分重要信息的丢失。该改进模型以极少的参数有效提升遥感卫星影像中物体的检测准确度。

【技术实现步骤摘要】

本专利技术涉及计算机视觉领域,特别涉及一种基于深度学习的遥感卫星影像目标检测方法


技术介绍

1、目前深度学习技术在计算机视觉领域得到了广泛的应用。目标检测是计算机视觉领域的一个重要方向,它的任务是在图像或视频中准确地定位和识别出所有感兴趣的物体。为满足不同应用场景对于检测时速度与准确度的不同需求,目标检测方法细化发展为一阶段目标检测方法和两阶段目标检测方法。不同于fast rcnn、faster rcnn等两阶段检测方法需要通过滑动窗口获得大量候选区域,再对初步定位的区域提取特征,yolov7作为一阶段目标检测算法将对象检测定义为一个回归问题,它在主干网络中使用高效层聚合网络(efficient layer aggregation networks,elan)进行特征提取,采用特征金字塔网络(feature pyramid network,fpn)和路径聚合网络(path aggregation network,pan)进行多尺度特征融合,得到三种不同尺度的输出特征层,最终经由检测头检测出物体类别和位置。虽然此方法在常规检测任务中对目标的检测速度和准确度都有着不错的效果,但对于遥感卫星从高空中获取的,存在大气扭曲、光照和视角变化、部分遮挡以及杂乱环境的影像进行检测时模型结构仍有很大提高空间。因此需要改进基于深度学习的目标检测模型结构,提升多重因素干扰的遥感卫星影像目标的检测性能。


技术实现思路

1、本专利技术提供一种基于深度学习的遥感卫星影像目标检测方法,在yolov7的基础上:在主干模块中使用最大池化下采样,在与最大池化相连接的高效层聚合网络中添加空间通道注意力模块;在融合模块中使用卷积模块下采样,使用包含前置降通道卷积的快速空间金字塔池化(spatial pyramid pooling fast,sppf)来扩大感受野;不再经过结构重参化卷积(repconv),直接将特征张量输入到检测头。改进后的网络模型对于受到多重干扰因素影响的遥感卫星影像的目标检测性能会有所提升,此外模型的参数量也进一步降低。包括如下步骤:

2、第一步:获取图像样本,构建训练集;

3、第二步:遥感卫星影像目标检测模型的构建;

4、步骤1、在输入端对输入图像采用马赛克增强的方式进行数据预处理;

5、步骤2、通过k均值聚类方法提取数据集的最优先验框;

6、步骤3、通过主干网络来提取图像的特征,在主干网络中通过简单的最大池化操作对特征图进行下采样,并且结合空间通道注意力(convolutional blockattentionmodule,cbam)机制构造改进的高效层聚合网络进行特征提取,具体为:

7、在主干网络中简单地使用大小为2*2的池化核,步长为2的最大池化模块进行下采样,对得到的下采样结果,接着经过两个并行分支提取特征,其中一个分支有五层串行的卷积层,将其中第一、第三和第五层的输出特征在通道维度上进行拼接;另一分支在有一个卷积层的基础上,又添加了一个空间通道注意力模块(cbam)。最后将并行分支得到的特征在通道维度上进行拼接,构造改进的高效层聚合网络,需要连续进行三次上述的操作进行特征提取。

8、步骤4、通过基于特征金字塔与路径聚合网络的结构将提取的特征进行处理得到多尺度融合特征。在融合模块中通过结合降通道的sppf扩大感受野,以及简单的下采样模块对特征图进行下采样,并通过检测头直连结构对特征进行预测和回归,具体为:

9、从主干网络接收32倍下采样张量后,首先进行降通道操作,再使用三个核大小为5的池化模块进行串行池化,池化结果在通道维度上进行拼接,最后降通道至池化金字塔前的通道数。接着对高层特征交替使用上采样与高效层聚合深度卷积网络获取更深层次的特征,对具有相同尺寸的特征图在通道维度上进行拼接操作,达到初步特征融合目的。最后在路径聚合网络中简单地使用大小为3*3的卷积核,步长为2的卷积模块进行下采样。在融合模块接近检测头的部分调整最后三个高效层聚合网络的输出通道数量,通道数量与特征尺寸成反比。经过输出尺寸调整的高效层聚合网络的张量不再通过结构重参化卷积,而是直接与检测头相连接。

10、步骤5、采用综合矩形框损失、分类损失和置信度损失的损失函数,对深度网络进行训练,得到遥感卫星影像目标检测模型。

11、第三步:将待检测的图像,利用上述第二步得到的遥感卫星影像目标检测模型实现目标检测,具体步骤如下:

12、在输入端对待检测的图像进行自适应黑边填充预处理;通过主干网络对输入图像进行特征提取;通过基于特征金字塔与路径聚合网络的结构将提取到的特征进行处理,得到多尺度的融合特征;通过预测端对于得到的多尺度融合特征图进行网格化预测,由预测出来的物体目标框和置信度获得图像的目标检测效果。

13、由于采用了上述的技术方案,本专利技术的有益效果:

14、本专利技术提供一种基于深度学习的目标检测新方法,预先利用公开的图像数据集对yolov7的模型进行改进,通过训练得到用于检测的改进版yolov7模型,该模型包括输入部分、主干部分,多尺度特征融合网络部分和预测部分。该方法改进了网络整体结构的下采样模块,在主干模块中简单的使用最大池化下采样,在路径聚合网络中使用卷积模块下采样。在主干网络中使用池化下采样不仅可以降低因图像存在大气扭曲、光照和视角变化、部分遮挡以及杂乱环境等因素所产生的噪音干扰,还可以显著降低计算量与参数量。在pan中使用单层卷积进行下采样能够在减少信息丢失的同时保证参数量与计算量不会提高。使用检测头直连结构代替原先网络模型中含结构重参化卷积(repconv)的引导头结构,使得网络预测部分不再臃肿。采用结合降通道的sppf代替原先网络模型中的sppcsp结构,不仅压缩了网络模型,减少了计算量,并且能更有效扩大感受野。此外在浅层elan模块中结合空间通道注意力(convolutional blockattention module,cbam)机制,弥补因池化下采样所造成的部分重要信息的丢失。该改进模型以极少的参数有效提升遥感卫星影像中物体的检测准确度。

本文档来自技高网...

【技术保护点】

1.一种基于深度学习的遥感卫星影像目标检测方法,其特征在于:其方法包括如下步骤:

2.根据权利要求1所述的一种基于深度学习的遥感卫星影像目标检测方法,其特征在于,所述第二步步骤3中在主干网络中通过简单的最大池化操作对特征图进行下采样,并且结合空间通道注意力CBAM机制构造改进的高效层聚合网络进行特征提取,具体为:

3.根据权利要求1所述的一种基于深度学习的遥感卫星影像目标检测方法,其特征在于,所述第二步步骤4中在融合模块中通过结合降通道的快速空间金字塔池化SPPF扩大感受野,以及简单的下采样模块对特征图进行下采样,并通过检测头直连结构对特征进行预测和回归,具体为:

4.根据权利要求1所述的一种基于深度学习的遥感卫星影像目标检测方法,其特征在于,所述第三步将待检测的图像,利用遥感卫星影像目标检测模型实现目标检测,具体为:

【技术特征摘要】

1.一种基于深度学习的遥感卫星影像目标检测方法,其特征在于:其方法包括如下步骤:

2.根据权利要求1所述的一种基于深度学习的遥感卫星影像目标检测方法,其特征在于,所述第二步步骤3中在主干网络中通过简单的最大池化操作对特征图进行下采样,并且结合空间通道注意力cbam机制构造改进的高效层聚合网络进行特征提取,具体为:

3.根据权利要求1所述的一种基于深度学习的...

【专利技术属性】
技术研发人员:卢奕南刘泓泽
申请(专利权)人:吉林大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1