一种针对密集区域的两阶段遥感图像目标检测方法技术

技术编号：24458125 阅读：51 留言：0更新日期：2020-06-10 16:10

本发明专利技术公开了一种针对密集区域的两阶段遥感图像目标检测方法，主要解决现有技术对目标密集区域目标识别准确率低的问题，其步骤为：1、对于输入图像进行数据增强操作，增加训练样本集；2、构建基于多尺度特征提取模块；3、在不同尺度的特征图上进行目标检测，找出目标密集的区域；4、针对目标密集的区域进行二次目标检测；5、对检测出的目标进行分类和位置回归，输出目标对应的分类标签和位置坐标，完成对图像的目标识别和定位。本发明专利技术利用网络多尺度结构的特点提取和融合不同尺度下的特征图来检测不同大小的目标，并对目标密集度高的区域进行二次检测，提高了小目标识别准确率。该方法可用于无人机以及卫星对目标的检测，侦查和监视。

A two-stage remote sensing image target detection method for dense area

全部详细技术资料下载

【技术实现步骤摘要】
一种针对密集区域的两阶段遥感图像目标检测方法
本专利技术涉及一种针对密集区域的两阶段遥感图像目标检测方法，可用于无人机以及卫星对目标的检测、侦查和监视，属于图像处理技术。
技术介绍
随着深度学习在计算机视觉领域的飞速发展，目标检测技术作为计算机视觉领域的一部分也得到了突破性的发展。近几年，与目标检测技术紧密相连的应用产品的出现，比如智慧城市监控、无人驾驶等，以及依靠目标检测技术支撑的如行人识别、目标追踪、视觉感知等技术的快速发展，都表明了目标检测在计算机视觉中的重要地位。作为计算机视觉领域的焦点和挑战，小目标的检测是目标检测领域中较难解决问题之一。以前的大多数的目标检测方法都是利用图像金字塔和基于手工制作的特征，对目标在不同的尺度上进行识别，以此提高目标检测的准确率。虽然目标特征的尺度对于检测任务至关重要，但考虑到内存和检测时间等问题，这些方法的准确率较低，计算成本较高，很难进行广泛的应用。近年来，随着深度卷积网络的到来，手工设计的特征被通过卷积神经网络计算的特征所取代，常见的图像特征提取的卷积神经网络如AlexNet、VGGNet、G本文档来自技高网...

【技术保护点】
1.一种针对密集区域的两阶段遥感图像目标检测方法，其特征在于：包括如下步骤：/n(a)图像数据增强/n对原始训练集中的每一张原始图像均依次进行旋转变换、反射变换、平移变换和对比度变换，最后把原始图像和变换后的图像统一成深度残差网络设定的输入尺寸，把统一尺寸后的图像作为对原始训练集数据增强后的训练集；/n(b)构建多尺度特征提取模块/n使用深度残差网络对训练集中的图像进行多尺度特征提取，将深度残差网络中的第三卷积块、第四卷积块、第五卷积块的最后一张特征图通过上采样的方式分别拼接到第二卷积块、第三卷积块、第四卷积块的最后一张特征图上，从而增加第二卷积块、第三卷积块、第四卷积块的最后一张特征图的语义...

【技术特征摘要】
1.一种针对密集区域的两阶段遥感图像目标检测方法，其特征在于：包括如下步骤：
(a)图像数据增强
对原始训练集中的每一张原始图像均依次进行旋转变换、反射变换、平移变换和对比度变换，最后把原始图像和变换后的图像统一成深度残差网络设定的输入尺寸，把统一尺寸后的图像作为对原始训练集数据增强后的训练集；
(b)构建多尺度特征提取模块
使用深度残差网络对训练集中的图像进行多尺度特征提取，将深度残差网络中的第三卷积块、第四卷积块、第五卷积块的最后一张特征图通过上采样的方式分别拼接到第二卷积块、第三卷积块、第四卷积块的最后一张特征图上，从而增加第二卷积块、第三卷积块、第四卷积块的最后一张特征图的语义性，并形成用于目标检测的特征金字塔；
训练时采用迁移学习策略，向深度残差网络导入经ImageNet数据集训练好的网络参数，将训练好的网络参数作为深度残差网络的初始化参数；
(c)对不同尺度的特征图像进行目标检测
在特征金字塔的每个像素点上设置不同尺寸的预定义边框，对预定义边框进行前景与背景的分类和位置回归得到初步预测边框，对所有初步预测边框采用非极大值抑制的方法进行筛选，再根据初步预测边框的前景概率值从筛选结果中选择出前景概率值最高的k1个初步预测边框作为初步预测前景边框；
(d)计算目标密集区域
对特征金字塔中的特征图进行区域划分，找出包含初步预测前景边框数量最多的区域，并将该区域映射到原始图像的对应区域上；
(e)对目标密集的区域进行二次目标检测
裁剪出原始图像的对应区域，将裁减出的原始图像缩放到深度残差网络设定的输入尺寸，并通过多尺度特征提取模块形成特征金字塔，在形成的特征金字塔的每个像素点上设置不同尺寸的预定义边框，对预定义边框进行前景与背景的分类和位置回归得到二次预测边框，对所有二次预测边框采用非极大值抑制的方法进行筛选，再根据二次预测边框的前景概率值从筛选结果中选择出前景概率值最高的k2个二次预测边框作为二次预测前景边框；
(f)获取目标的检测和识别结果
对初步预测前景边框和二次预测前景边框进行非极大值抑制操作过滤掉交并比大于设定阈值的预测前景边框，再根据前景概率值从过滤结果中选择出前景概率值最高的k3个预测前景边框作为可能为目标的区域，将这些可能为目标的区域作为预选边框，对预选边框所在的特征区域进行池化，统一目标特征的大小；
将统一大小后的目标特征分别放入两个全连接层后分别连接一个用于分类的分类输出层和一个用于位置回归的回归输出层，将分类输出层输出的类别概率值和位置回归层输出的位置信息共同作为目标预测边框，根据目标预测边框的位置信息和类别概率值对目标预测边框进行非极大值抑制过滤后，选择出类别概率值最大的k个目标预测边框作为目标的识别结果；进行非极大值抑制时通过设置边框的交并比阈值来调节过滤的程度。

2.根据权利要求1所述的针对密集区域的两阶段遥感图像目标检测方法，其特征在于：所述步骤(b)中，将深度残差网络中的第三卷积块、第四卷积块、第五卷积块的最后一张特征图通过上采样的方式拼接到第二卷积块、第三卷积块、第四卷积块最后一张特征图上，形成特征金字塔(P2，P3，P4，P5)，具体方法为：
特征图P5：第5个卷积块的最后一张特征图经过膨胀率为2的空洞卷积，生成特征图P5；
特征图P4：先上采样第5个卷积块的最后一张特征图，...

【专利技术属性】
技术研发人员：赵佳琦，朱东郡，夏士雄，周勇，姚睿，陈莹，张迪，
申请(专利权)人：中国矿业大学，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人