当前位置: 首页 > 专利查询>武汉大学专利>正文

一种基于裁剪区域候选网络的目标检测方法及系统技术方案

技术编号:22330728 阅读:53 留言:0更新日期:2019-10-19 12:23
本发明专利技术公开了一种基于裁剪区域候选网络的目标检测方法及系统,首先采集遥感数据集,并划分为训练集、验证集和测试集;然后生成包含感兴趣对象的裁剪区域;接着执行每个剪裁区域的对象检测;最后合并多个裁剪区域的检测结果,并去除冗余检测结果,得到最后检测结果。本发明专利技术可以快速定位感兴趣区域,并能同时检测极大尺度目标和极小尺度目标的双尺度训练策略,从而在有限的资源下,高效地对大尺度遥感图像进行对象检测;本发明专利技术提出的一种基于模块化设计的裁剪区域网络CRPN,包含弱语义RPN(弱语义特征抽取网络和基于弱语义特征的RPN网络)与剪裁区域生成算法,其可以与传统的目标检测网络(如:Faster RCNN)相结合,实现大尺度遥感图像的高性能对象检测。

【技术实现步骤摘要】
一种基于裁剪区域候选网络的目标检测方法及系统
本专利技术属于图像识别
,尤其涉及一种基于裁剪区域候选网络的目标检测方法计系统,能够在GPU内存有限的情况下实现对大尺度遥感图像的高性能目标检测。
技术介绍
地理空间目标的检测是遥感图像分析和理解的基础和难点问题。近期,深度学习显著提高了各种图像处理技术的性能,卷积神经网络(CNN)的目标检测器已经达到了当前最好的水平。然而,由于自然图像和遥感图像存在明显的差异,这些目标检测方法很难在遥感图像中有同样出色的表现。遥感图像的尺度通常比较大,由于硬件的限制,目标检测算法不能直接对整个图像进行检测。对这种大尺度图像进行目标检测的方法通常有两种。一种方法是缩小图像,但这种操作会进一步缩小微小目标的尺寸,大大降低检测小目标的能力。另一种方法是将图像裁剪成许多小块进行分块检测,但这会影响检测精度,因为大目标可能被分到不同的分块中。另外,由于在遥感图像中通常存在大面积的非感兴趣区域。若对整个图像进行处理,这些无用区域的检测将会浪费有限的计算资源和存储空间。遥感图像中物体像素大小因类别不同而存在差异。比如DOTA数据集中,一个桥的可能有1200个像素那么大,而一个小型车辆可能只有10个像素点那么大。由于尺度范围太大,现有的检测模型不够灵活,无法同时处理非常微小和巨大的目标。在FasterRCNN及其CNNs变体中,区域候选网络(RPN)的锚定尺寸通常为(642,1282,2562)或者(1282,2562,5122),热门目标检测网络YOLO及其相关升级网络中网格单元的预测尺寸也被限制在一个合适的预测框尺度范围内。还有其他一些方法,其检测范围在32-512之间,但仍不能覆盖遥感对象的尺度分布。因此,传统的方法不适合直接用于遥感图像中尺度范围较大的地理空间目标的检测。
技术实现思路
为了有效地对大尺度遥感图像进行目标检测,本专利技术提出了一种有效的目标检测方法及系统,以能够在GPU内存有限的情况下实现对大尺度遥感图像进行高性能目标检测。本专利技术的方法所采用的技术方案是:一种基于裁剪区域候选网络的目标检测方法,其特征在于,包括以下步骤:步骤1:采集遥感数据集,并划分为训练集、验证集和测试集;步骤2:生成包含感兴趣对象的裁剪区域;步骤3:执行每个剪裁区域的对象检测;步骤4:合并多个裁剪区域的检测结果,并去除冗余检测结果,得到最后检测结果。作为优选,步骤2的具体实现包括以下子步骤:步骤2.1:通过弱语义特征抽取网络生成只考虑前景和背景语义及定位功能的弱语义特征,同时基于弱语义特征来进行区域假设;在弱语义特征抽取网络中,通过削减每个卷积层的通道数来简化特征表达能力,其中弱化的特征图仅保留对感兴趣对象ROI整体定位能力及边界锁定能力,以及区分前景和背景语义,而不考虑ROI所属的具体类别语义;每个卷积层通道数减少到传统特征抽取网络的相应地,弱语义特征抽取网络的损失函数定义为:其中,预测边界框的损失函数与目标检测网络Faster-RCNN一样,对象分类的损失函数定义为前景损失函数Lfore,pi是预测第i个建议区域是前景的可能性,如果对应的i个建议区域是前景,则为1,否则设为0,Nfore为预测类别数量,Lreg表示为边界损失函数,其中ti表示边界元素的预测值,表示边界元素的真实值;Nreg表示边界元素,包括中心点坐标(x,y)和宽高(w,h);λ用于控制两个损失的比例;步骤2.2:生成裁剪区域;通过弱语义RPN网络来获取每个预测对象的位置与边界,筛选合并邻近预测区域来生成感兴趣的裁剪区域,以减少裁剪区域数量,并进行目标检测实现对大尺度图像的整体检测。作为优选,步骤2.2中所述进行目标检测实现对大尺度图像的整体检测,具体实现包括以下子步骤:步骤2.2.1:通过弱语义RPN,输出的预测区域B={b1,b2,...,bn};步骤2.2.2:设定一个范围阈值τ,基于范围阈值τ,将整个B的设置分为两个子集Bs,Bl;把预测尺度大于τ的预测区域归入子集Bl中,把预测尺度小于τ的归于子集Bs中。步骤2.2.3:把Bl中所有大于τ的预测区域,通过进行空间相邻的区域合并,但合并后的区域尺度的缩放尺度不能超过计算机的最大处理尺度,来生成预裁剪区域。迭代该操作,最终生成大预测尺度剪裁区域集CRl;把Bs中所有小于τ的预测区域,通过进行空间相邻的区域合并,但合并后的区域尺度不能超过计算机的最大处理尺度,最终生成预裁剪区域。迭代该操作,最终生成小预测尺度剪裁区域集CRs。作为优选,步骤3的具体实现过程是:针对裁剪候选网络CRPN输出两个不同尺度的剪裁区域CRs和CRl,分别进行不同的数据处理以训练目标检测网络;对于CRs中的小预测尺度裁剪区域,首先根据每个裁剪区域获取裁剪后的子图像和对应的真实标签,然后对目标检测网络进行训练;对于CRl中的大预测尺度裁剪区域,将裁剪后的子图像缩小,并设定尺度阈值以过滤掉尺度小于阈值的真实标签;然后对目标检测网络进行训练。作为优选,步骤4中,通过NMS算法去除冗余,以得到最后的大尺度图像检测结果。本专利技术的系统所采用的技术方案是:一种基于裁剪区域候选网络的目标检测系统,其特征在于:包括遥感数据集采集划分模块、裁剪模块、对象检测模块、检测结果生成模块;所述包括遥感数据集采集划分模块,用于采集遥感数据集,并划分为训练集、验证集和测试集;所述裁剪模块,用于生成包含感兴趣对象的裁剪区域;所述对象检测模块,用于执行每个剪裁区域的对象检测;所述检测结果生成模块,用于合并多个裁剪区域的检测结果,并去除冗余检测结果,得到最后检测结果。与现有技术相比,本专利技术具有以下优点和积极效果:(1)本专利技术的技术方案,可以快速定位感兴趣区域,以及同时检测极大尺度目标和极小尺度目标的双尺度训练策略,从而在有限的资源下,高效地对大尺度遥感图像进行高性能对象检测;(2)本专利技术提出的一种基于模块化设计的裁剪区域网络CRPN,包含弱语义RPN(弱语义特征抽取网络和基于弱语义特征的RPN网络)与剪裁区域生成算法,其可以与传统的目标检测网络(如:FasterRCNN)相结合,实现大尺度遥感图像的高性能对象检测。附图说明图1是本专利技术实施例的方法原理图。具体实施方式为了便于本领域普通技术人员理解和实施本专利技术,下面结合附图及实施例对本专利技术作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本专利技术,并不用于限定本专利技术。请见图1,本专利技术提供的一种基于裁剪区域候选网络的目标检测方法,包括以下步骤:步骤1:采集遥感数据集,并划分为训练集、验证集和测试集;本实施例中,获取DOTA数据集,该数据集被划分为训练集,验证集,测试集,其中包括2806个图像和188282个实例标签。步骤2:生成包含感兴趣对象的裁剪区域;本实施例中,步骤2的具体实现包括以下子步骤:步骤2.1:通过弱语义特征抽取网络生成只考虑前景和背景语义及定位功能的弱语义特征,同时基于弱语义特征来进行区域假设;本实施例把弱语义特征抽取网络和基于弱语义的区域假设网络的联合网络称之为弱语义RPN。在弱语义特征抽取网络中,通过削减每个卷积层的通道数来简化特征表达能力,其中弱化的特征图仅保留对感兴趣对象ROI整体定位能力及边界锁定能力,以及区分前景和背景语义,而不考虑ROI本文档来自技高网
...

【技术保护点】
1.一种基于裁剪区域候选网络的目标检测方法,其特征在于,包括以下步骤:步骤1:采集遥感数据集,并划分为训练集、验证集和测试集;步骤2:生成包含感兴趣对象的裁剪区域;步骤3:执行每个剪裁区域的对象检测;步骤4:合并多个裁剪区域的检测结果,并去除冗余检测结果,得到最后检测结果。

【技术特征摘要】
1.一种基于裁剪区域候选网络的目标检测方法,其特征在于,包括以下步骤:步骤1:采集遥感数据集,并划分为训练集、验证集和测试集;步骤2:生成包含感兴趣对象的裁剪区域;步骤3:执行每个剪裁区域的对象检测;步骤4:合并多个裁剪区域的检测结果,并去除冗余检测结果,得到最后检测结果。2.根据权利要求1所述的基于裁剪区域候选网络的目标检测方法,其特征在于,步骤2的具体实现包括以下子步骤:步骤2.1:通过弱语义特征抽取网络生成只考虑前景和背景语义及定位功能的弱语义特征,同时基于弱语义特征来进行区域假设;在弱语义特征抽取网络中,通过削减每个卷积层的通道数来简化特征表达能力,其中弱化的特征图仅保留对感兴趣对象ROI整体定位能力及边界锁定能力,以及区分前景和背景语义,而不考虑ROI所属的具体类别语义;每个卷积层通道数减少到传统特征抽取网络的相应地,弱语义特征抽取网络的损失函数定义为:其中,预测边界框的损失函数与目标检测网络Faster-RCNN一样,对象分类的损失函数定义为前景损失函数Lfore,pi是预测第i个建议区域是前景的可能性,如果对应的i个建议区域是前景,则为1,否则设为0,Nfore为预测类别数量,Lreg表示为边界损失函数,其中ti表示边界元素的预测值,表示边界元素的真实值;Nreg表示边界元素,包括中心点坐标(x,y)和宽高(w,h);λ用于控制两个损失的比例;步骤2.2:生成裁剪区域;通过弱语义RPN网络来获取每个预测对象的位置与边界,筛选合并邻近预测区域来生成感兴趣的裁剪区域,以减少裁剪区域数量,并进行目标检测实现对大尺度图像的整体检测。3.根据权利要求2所述的基于裁剪区域候选网络的目标检测方法,其特征在于,步骤2.2中所述进行目标检测实现对大尺度图像的整体检测,具体实现包括以下子步骤:步骤2.2.1输入弱语义特征抽取网络输出的裁剪区...

【专利技术属性】
技术研发人员:袁志勇林啓峰赵俭辉
申请(专利权)人:武汉大学
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1