基于通道注意力与多尺度特征融合的轻量级遥感目标检测方法技术

技术编号:35919147 阅读:17 留言:0更新日期:2022-12-10 11:02
本发明专利技术公开了基于通道注意力与多尺度特征融合的轻量级遥感目标检测方法,包括:获取遥感数据;将遥感数据中的图片输入训练好的遥感目标检测模型;根据模型的输出,确定遥感目标检测结果;模型的构建训练方法包括:获取数据集,使用Kmeans聚类算法对数据集作聚类处理,获得一组锚框;构建主干网络提取特征图;在主干网络后构建快速空间金字塔池化结构进行特征融合;构建三层的加强特征提取网络BiFPN,融合浅层特征图的空间信息与深层特征图的语义信息;在BiFPN后构建通道注意力模块ECA;在ECA后构建三个预测输出头,进行预测;利用数据集及锚框训练并评估模型。网络参数少计算量小,提高了检测精度的同时满足了实时性。提高了检测精度的同时满足了实时性。提高了检测精度的同时满足了实时性。

【技术实现步骤摘要】
基于通道注意力与多尺度特征融合的轻量级遥感目标检测方法


[0001]本专利技术涉及遥感图像处理领域,具体但不限于涉及基于通道注意力与多尺度特征融合的轻量级遥感目标检测方法。

技术介绍

[0002]目标检测是计算机视觉领域近几年的热门研究方向之一,其任务是识别出图像中感兴趣物体的类别,并同时检测出物体的位置和大小。目标检测是图像理解与计算机视觉的基石,作为计算机视觉的基本问题之一,目标检测构成了许多其它视觉任务的基础,例如实例分割,目标跟踪和图像描述等等。随着信息化技术的不断发展,目标检测技术在近几年发展迅速,其广泛应用在生物医药、监控安防、航天航空等领域,深刻影响着人们的生活。
[0003]深度学习的发展促进了目标检测技术在遥感图像领域的应用,基于深度学习的遥感图像目标检测性能普遍优于传统方法,检测精度有了大幅度的提升。然而遥感图像具有场景复杂、尺度多样和目标较小等问题,增大了对其目标检测的难度。近年来,虽然基于深度学习的遥感图像目标检测算法性能优异,但是模型结构复杂,参数量与计算量较大,对小目标的检测性能仍有广阔的提升空间。因此在提升一定检测精度的同时,研究轻量化的遥感图像目标检测模型具有较强的理论意义和应用价值。
[0004]有鉴于此,需要提供一种新的检测方法,以期解决上述至少部分问题。

技术实现思路

[0005]针对现有技术中的一个或多个问题,本专利技术提出了一种基于通道注意力与多尺度特征融合的轻量级遥感目标检测方法。
[0006]实现本专利技术目的的技术解决方案为:r/>[0007]第一方面,提供一种基于通道注意力与多尺度特征融合的轻量级遥感目标检测方法,包括:
[0008]获取遥感数据,其中所述遥感数据包括至少一张图片;
[0009]将遥感数据中的图片输入训练好的遥感目标检测模型;
[0010]根据遥感目标检测模型的输出,确定遥感目标检测结果;
[0011]其中所述遥感目标检测模型的构建训练方法包括:
[0012]步骤1:获取数据集;
[0013]步骤2:使用Kmeans聚类算法对数据集作聚类处理,获得一组锚框;
[0014]步骤3:构建主干网络经过特征提取得到特征图;
[0015]步骤4:在主干网络后构建快速空间金字塔池化结构SPPF进行特征融合得到融合特征图;
[0016]步骤5:在快速空间金字塔池化结构SPPF后构建三层的加强特征提取网络BiFPN,融合浅层特征图的空间信息与深层特征图的语义信息,减少信息丢失;
[0017]步骤6:在加强特征提取网络BiFPN后构建三个通道注意力模块ECA,使网络更加关注目标的细节信息,提高检测精度;
[0018]步骤7:在每个通道注意力模块ECA后构建一个预测输出头,对输出的特征进行预测;
[0019]步骤8:利用所述数据集及锚框对遥感目标检测模型进行训练并评估,利用最佳模型进行测试,得到训练好的遥感目标检测模型。
[0020]在一些实施例中,所述步骤1中,获取数据集,包括:
[0021]所述数据集至少包括遥感数据集DOTA v1.0、数据集VOC12以及遥感数据集RSOD、遥感数据集DIOR;
[0022]其中数据集VOC12、RSOD的训练集,验证集,测试集按照7:1:2进行随机划分,DIOR按照官方给出的比例1:1:2进行随机划分;
[0023]其中遥感数据集DOTA v1.0需要先进行预处理,包括:
[0024]步骤1

1:选取遥感数据集DOTA v1.0中水平标注部分的图片;将选取的每张图片切割为多张固定大小的图片,并对切割后的图片生成相应的标注信息xml文件;
[0025]步骤1

2:对步骤1

1得到的xml文件进行处理,删除不符合要求的xml文件及对应的图片,得到处理后的DOTA数据集;
[0026]其中不符合要求的xml文件有以下三种情况:标注目标为空;所有标注目标的difficult值均为1;标注目标存在越界的问题,标注目标存在越界有六种情况:xmin<0、ymin<0、xmax>width、ymax>height、xmax<xmin、ymax<ymin;其中xmin:标注框最小横坐标值;ymin:标注框最小纵坐标值;xmax:标注框最大横坐标值;ymax:标注框最大纵坐标值;width:图片的宽;height:图片的高;
[0027]步骤1

3:对步骤1

2得到的处理后的DOTA数据集进行划分,划分为train、val、trainval、test四个文件,训练集,验证集,测试集按照7:1:2进行随机划分。
[0028]在一些实施例中,所述步骤2中,使用Kmeans聚类算法对数据集作聚类处理,包括:
[0029]步骤2

1:根据数据集,在所有的边界框中随机选择K个作为簇中心;
[0030]步骤2

2:计算每个边界框与每个簇中心的距离D,公式如下:
[0031][0032]D=1

IOU
[0033]式中,A、B分别为边界框与簇中心,IoU为A和B的交并比;
[0034]步骤2

3:计算每个边界框距离最近的簇中心,并分配到离它最近的簇中;
[0035]步骤2

4:根据每个簇中的边界框重新计算簇中心,默认使用中位数来更新簇中心;
[0036]步骤2

5:重复2

3到2

4,直到每个簇中的元素不在发生变化则聚类完毕,得到K个簇中心,即所需要的锚框;
[0037]步骤2

6:考虑到预测网络中K值较大时,会增加神经网络的预测时间,因而簇中心的个数K设置为9;在各数据集上使用的锚框如下:
[0038]DOTA v1.0:(11,10)(20,22)(29,41)(43,25)(44,98)(47,45)(78,63)(100,106)(169,202)
[0039]RSOD:(14,15)(22,23)(30,29)(36,39)(47,48)(55,62)(68,74)(80,92)(223,275)
[0040]DIOR:(7,7)(8,16)(14,28)(19,11)(26,47)(36,20)(57,60)(107,128)(278,280)
[0041]VOC12:(21,40)(52,68)(62,141)(97,272)(159,155)(177,380)(303,495)(372,267)(549,556)。
[0042]在一些实施例中,所述步骤3中,主干网络的构建方法包括:
[0043]步骤3
...

【技术保护点】

【技术特征摘要】
1.基于通道注意力与多尺度特征融合的轻量级遥感目标检测方法,其特征在于,包括:获取遥感数据,其中所述遥感数据包括至少一张图片;将遥感数据中的图片输入训练好的遥感目标检测模型;根据遥感目标检测模型的输出,确定遥感目标检测结果;其中所述遥感目标检测模型的构建训练方法包括:步骤1:获取数据集;步骤2:使用Kmeans聚类算法对数据集作聚类处理,获得一组锚框;步骤3:构建主干网络经过特征提取得到特征图;步骤4:在主干网络后构建快速空间金字塔池化结构SPPF进行特征融合得到融合特征图;步骤5:在快速空间金字塔池化结构SPPF后构建三层的加强特征提取网络BiFPN,融合浅层特征图的空间信息与深层特征图的语义信息,减少信息丢失;步骤6:在加强特征提取网络BiFPN后构建三个通道注意力模块ECA,使网络更加关注目标的细节信息,提高检测精度;步骤7:在每个通道注意力模块ECA后构建一个预测输出头,对输出的特征进行预测;步骤8:利用所述数据集及锚框对遥感目标检测模型进行训练并评估,利用最佳模型进行测试,得到训练好的遥感目标检测模型。2.根据权利要求1所述的基于通道注意力与多尺度特征融合的轻量级遥感目标检测方法,其特征在于,所述步骤1中,获取数据集,包括:所述数据集至少包括遥感数据集DOTA v1.0、数据集VOC12以及遥感数据集RSOD、遥感数据集DIOR;其中数据集VOC12、RSOD的训练集,验证集,测试集按照7:1:2进行随机划分,DIOR按照官方给出的比例1:1:2进行随机划分;其中遥感数据集DOTA v1.0需要先进行预处理,包括:步骤1

1:选取遥感数据集DOTA v1.0中水平标注部分的图片;将选取的每张图片切割为多张固定大小的图片,并对切割后的图片生成相应的标注信息xml文件;步骤1

2:对步骤1

1得到的xml文件进行处理,删除不符合要求的xml文件及对应的图片,得到处理后的DOTA数据集;其中不符合要求的xml文件有以下三种情况:标注目标为空;所有标注目标的difficult值均为1;标注目标存在越界的问题,标注目标存在越界有六种情况:xmin<0、ymin<0、xmax>width、ymax>height、xmax<xmin、ymax<ymin;其中xmin:标注框最小横坐标值;ymin:标注框最小纵坐标值;xmax:标注框最大横坐标值;ymax:标注框最大纵坐标值;width:图片的宽;height:图片的高;步骤1

3:对步骤1

2得到的处理后的DOTA数据集进行划分,划分为train、val、trainval、test四个文件,训练集,验证集,测试集按照7:1:2进行随机划分。3.根据权利要求1所述的基于通道注意力与多尺度特征融合的轻量级遥感目标检测方法,其特征在于,所述步骤2中,使用Kmeans聚类算法对数据集作聚类处理,包括:步骤2

1:根据数据集,在所有的边界框中随机选择K个作为簇中心;步骤2

2:计算每个边界框与每个簇中心的距离D,公式如下:
D=1

IOU式中,A、B分别为边界框与簇中心,IoU为A和B的交并比;步骤2

3:计算每个边界框距离最近的簇中心,并分配到离它最近的簇中;步骤2

4:根据每个簇中的边界框重新计算簇中心,默认使用中位数来更新簇中心;步骤2

5:重复2

3到2

4,直到每个簇中的元素不在发生变化则聚类完毕,得到K个簇中心,即所需要的锚框;步骤2

6:考虑到预测网络中K值较大时,会增加神经网络的预测时间,因而簇中心的个数K设置为9;在各数据集上使用的锚框如下:DOTA v1.0:(11,10)(20,22)(29,41)(43,25)(44,98)(47,45)(78,63)(100,106)(169,202)RSOD:(14,15)(22,23)(30,29)(36,39)(47,48)(55,62)(68,74)(80,92)(223,275)DIOR:(7,7)(8,16)(14,28)(19,11)(26,47)(36,20)(57,60)(107,128)(278,280)VOC12:(21,40)(52,68)(62,141)(97,272)(159,155)(177,380)(303,495)(372,267)(549,556)。4.根据权利要求1所述的基于通道注意力与多尺度特征融合的轻量级遥感目标检测方法,其特征在于,所述步骤3中,主干网络的构建方法包括:步骤3

1:图片输入的尺寸设置为416*416,首先构建两个卷积模块DarknetConv2D_BN_Leaky用于获取特征图,卷积模块包括一个3*3的二维卷积,归一化和激活函数Leaky ReLu,步长设置为2;第一个卷积模块使图片尺寸降为208*208,第二个卷积模块再次缩小图片尺寸为104*104,Leaky ReLu函数表达式如下,x代表输入值:步骤3

2:在两个卷积模块后串行构建三个残差网络Reduction;残差网络分成两条支路,第一条支路是将输入的特征图进行一次1*1卷积,特征图尺寸不变;再进行一次3*3卷积,使特征图的尺寸减小一半;最后进行一次1*1卷积,特征图的尺寸不变;第二条支路是将输入的特征图进行一次2*2的最大池化,使特征图尺寸减半;再进行一次1*1卷积,特征图尺寸不变;将这两条支路输出的特征图进行堆叠拼接,最终获得尺寸减半后的特征图;第一残差网络、第二残差网络、第三残差网络输出的特征图尺寸分别为:52*52、26*26、13*13;步骤3

【专利技术属性】
技术研发人员:魏新池郑钰辉
申请(专利权)人:南京信息工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1