一种基于旋转定位网络的光学遥感图像飞机目标检测方法技术

技术编号:24093256 阅读:35 留言:0更新日期:2020-05-09 09:03
一种基于旋转定位网络的光学遥感图像飞机目标检测方法,包括如下步骤,步骤S1、将图片输入ResNet特征网络,提取出多维度特征信息,获取用多维数组表示的特征图;步骤S2、特征图输入累积特征金字塔网络中,将高层语义与底层语义相融合,将高层语义的接收域和上下文信息与底层语义的目标位置信息提炼在一起;步骤S3、RPN子网络在累积特征金字塔网络输出的特征中产生锚框,并对锚框进行边界回归和前景分类,获取水平提议框;步骤S4、将水平提议框送入旋转区域定位网络进行旋转和缩放,生成旋转目标框,最终输出飞机目标旋转检测框。本发明专利技术利用累积特征金字塔网络进行特征融合,还采用旋转矩形包围框,减少框定目标后的背景冗余,在密集场景下,使检测结果更准确。

A method of aircraft target detection in optical remote sensing image based on rotary positioning network

【技术实现步骤摘要】
一种基于旋转定位网络的光学遥感图像飞机目标检测方法
本专利技术属于图像检测
,具体涉及一种基于旋转定位网络的光学遥感图像飞机目标检测方法。
技术介绍
飞机目标检测是评估机场功能与重要程度、掌握敌情动态的重要途径。随着遥感影像技术日趋成熟,遥感图像分辨率变高,包含的信息量增多,因此飞机目标检测方法越来越多的使用遥感图像作为检测的基础结构。在这种趋势下,近些年大热的机器学习方法也被广泛运用于这一领域。虽然技术日益成熟,但是飞机目标检测方法仍然存在许多的困难和挑战:1、机场停机坪上的飞机往往是密集排布的,遥感卫星图像拍摄的图片中,飞机目标距离较近,使用传统的水平检测框会存在检测框重叠的情况,并且在包围框内会存在大量地冗余,在选取前景和背景的筛选过程中,也会将部分正确的目标框误删,导致检测效果不好;2、目前,主流的机器学习方法主要通过复杂的特征提取过程以及具有针对性的参数选取实现飞机目标的检测,这种方法过于依赖人工,在复杂场景下的鲁棒性不强,无法推广应用。即使是鲁棒性较强的深度网络,仅考虑特征提取网络最后一层包含高级语义的featuremap,会失去很多飞机目标位置信息;3、飞机目标检测大部分使用的是网络上的公共数据集,其图片来源是网上爬取的一些飞机图片,并未有针对性地考虑拍摄视角、飞机地点分布、是否具有多样性等特点,由公共数据集训练出来的网络模型性能层次不齐,且普遍检测效果不佳,检测网络不具有普适性。飞机目标识别是基于所给影像信息进行飞机物体检测,并将目标在影像上框定出来。它不仅仅依赖于所给图像信息的完备与否,还依赖于检测算法的选取、训练方式以及应用的具体场景。飞机目标检测往往存在所给数据信息不足、训练效果不佳和密集场景检测效果不好等问题。
技术实现思路
本专利技术所要解决的技术问题是克服现有技术的不足,提供一种基于旋转定位网络的光学遥感图像飞机目标检测方法,利用累积特征金字塔网络进行特征融合,该方法还采用旋转矩形包围框,减少框定目标后的背景冗余,在密集场景下,使检测结果更准确。本专利技术提供一种基于旋转定位网络的光学遥感图像飞机目标检测方法,包括如下步骤,步骤S1、将图片输入ResNet特征网络,提取出多维度特征信息,获取用多维数组表示的特征图;步骤S2、特征图输入累积特征金字塔网络中,将高层语义与底层语义相融合,将高层语义的接收域和上下文信息与底层语义的目标位置信息提炼在一起;步骤S3、RPN子网络在累积特征金字塔网络输出的特征中产生锚框,并对锚框进行边界回归和前景分类,获取水平提议框;步骤S4、将水平提议框送入旋转区域定位网络进行旋转和缩放,生成旋转目标框,最终输出飞机目标旋转检测框。作为本专利技术的进一步技术方案,步骤S2中,累积特征金字塔网络从最高语义层开始,对本层以上每一个featuremap进行最近邻上采样,获取与本层大小相同的featuremap,再进行拼接合并,拼接合并的featuremap和本层的featuremap分别经过1*1的卷积核处理,处理后的两个featuremap对应元素相加,获取的结果再通过3*3卷积核处理,获取一个单层多维度featuremap。进一步的,步骤S3中,采用置信度排序的方法减少RPN子网络产生的锚框数量,保留高置信度的水平提议框;水平提议框作为负样本需满足背景与标签框的交并比值在[0.1,0.3]之间或具有高置信度值,并且与标签框无交集。进一步的,步骤S4中,将水平检测框转换为旋转检测框,使用旋转区域定位网络对检测框进行回归预测,旋转的角度为,并调整矩形框的宽w和高h,旋转边界框参数化坐标回归包括和两个附加变量,参数化坐标定义如下:;其中,为包围框中心点坐标,分别为包围矩形框的长边和短边;、和分别代表预测框、锚框和真实的包围框的参数,参数以此类推;为水平框相对于图像坐标轴的x正半轴逆时针旋转的角度,为矩形包围框的对角线长度;采用损失函数表示旋转框与真实包围框之间的损失,其定义为:;其中,为标签中的实际向量,为预测向量。本专利技术的有益效果如下:1、本专利技术使用旋转矩形框表示飞机目标,在飞机目标密集的场景下,能够无重叠地框出飞机目标位置。旋转矩形框内的冗余背景少,目标更精确,也减少网络训练时,背景特征对目标特征的干扰,使网络的学习效率更高。2、本专利技术采用累积特征金字塔网络,能显著提高小目标物体的检测准确率。在大尺寸光学遥感图像中,飞机目标相对较小,累积特征金字塔网络将底层语义的飞机目标位置信息进行了加权融合,提高了飞机目标特征提取中位置信息的比重,定位更精确。3、本专利技术使用的数据集更为健全,本专利技术使用的飞机数据库综合多各方面考虑,具有时空范围广、覆盖的尺度范围多样、飞机种类多和视角多样化的优点。对深度网络训练起到关键性作用,深度网络能够学习到飞机目标更多的特征,从而提高网络最终的检测准确率和召回率。附图说明图1为累积特征金字塔网络对featuremap进行处理的示意图;图2为旋转矩形框及其向量表示方式中的参数含义示意图;图3为飞机目标检测流程图。具体实施方式对本实施例中的使用的数据集进行划分,其中20%划分为测试集,80%为训练集,为了使训练时超参设置得更加准确,故将训练集的20%划分为验证集,保证网络模型的鲁棒性较好。在做好数据集划分后,如图3所示所示,开始将图片送入网络。本方法包括如下步骤,步骤1:先初始化除特征提取网络以外的参数,然后将数据集图片按批次送入特征提取网络ResNet,特征提取网络ResNet使用官方权重值。图片的三维数组经过ResNet网络的残差模块提取,变为一个更深维度的数组,这个数组表示图片中的特征信息,包含了上下文信息、接受域信息和飞机目标位置信息。步骤2:在步骤1中,Resnet网络中每个残差模块的最后一层得到的featuremap具有不同的卷积步长,并且每一层featuremap的大小也不一样,最上层的featuremap尺寸最小,具有高级语义,包含更多的接受域、上下文信息和较少的飞机目标位置信息,最下层的featuremap尺寸最大,包含较少的接受域、上下文信息和更多的飞机目标位置信息。累积特征金字塔网络由这些多层featuremap构成一种塔状结构,金字塔的每层由上往下呈现逐层变化的趋势。将各层的featuremap信息进行融合,得到一个包含丰富的接受域、上下文信息和较多飞机目标位置信息的多维featuremap。步骤2-1:由图1可知,累积特征金字塔网络信息融合过程如下:对上面的每一个featuremap进行最近邻上采样处理,得到大小相同的featuremap,然后进行拼接合并。拼接合并的featuremap和本层的featuremap分别经过一个的卷积核处理,减小他们的通道维度大小。将两个经过的卷积核处理的featuremap对本文档来自技高网
...

【技术保护点】
1.一种基于旋转定位网络的光学遥感图像飞机目标检测方法,其特征在于,包括如下步骤,/n步骤S1、将图片输入ResNet特征网络,提取出多维度特征信息,获取用多维数组表示的特征图;/n步骤S2、特征图输入累积特征金字塔网络中,将高层语义与底层语义相融合,将高层语义的接收域和上下文信息与底层语义的目标位置信息提炼在一起;/n步骤S3、RPN子网络在累积特征金字塔网络输出的特征中产生锚框,并对锚框进行边界回归和前景分类,获取水平提议框;/n步骤S4、将水平提议框送入旋转区域定位网络进行旋转和缩放,生成旋转目标框,最终输出飞机目标旋转检测框。/n

【技术特征摘要】
1.一种基于旋转定位网络的光学遥感图像飞机目标检测方法,其特征在于,包括如下步骤,
步骤S1、将图片输入ResNet特征网络,提取出多维度特征信息,获取用多维数组表示的特征图;
步骤S2、特征图输入累积特征金字塔网络中,将高层语义与底层语义相融合,将高层语义的接收域和上下文信息与底层语义的目标位置信息提炼在一起;
步骤S3、RPN子网络在累积特征金字塔网络输出的特征中产生锚框,并对锚框进行边界回归和前景分类,获取水平提议框;
步骤S4、将水平提议框送入旋转区域定位网络进行旋转和缩放,生成旋转目标框,最终输出飞机目标旋转检测框。


2.根据权利要求1所述的一种基于旋转定位网络的光学遥感图像飞机目标检测方法,其特征在于,所述步骤S2中,累积特征金字塔网络从最高语义层开始,对本层以上每一个featuremap进行最近邻上采样,获取与本层大小相同的featuremap,再进行拼接合并,拼接合并的featuremap和本层的featuremap分别经过1*1的卷积核处理,处理后的两个featuremap对应元素相加,获取的结果再通过3*3卷积核处理,获取一个单层多维度featuremap。


3.根据...

【专利技术属性】
技术研发人员:周亮李陈刘希鹏康彬陈建新
申请(专利权)人:南京邮电大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1