一种面向小目标检测的网络和困难样本挖掘方法技术

技术编号：23605395 阅读：49 留言：0更新日期：2020-03-28 06:18

本发明专利技术公开了一种面向小目标检测的网络和困难样本挖掘方法，包括以下步骤：步骤一、使用主干网络提取当前图像主干特征；步骤二、构造颈部网络，生成特征金字塔；步骤三、构造区域生成网络模型，生成感兴趣区域；步骤四、基于困难样本挖掘生成训练数据；步骤五、使用感兴趣区域对齐模块裁剪区域特征；步骤六、使用头部网络分类和定位目标。本发明专利技术能够显著提高小目标检测精度，且仅少量增加计算开销。

A network and difficult sample mining method for small target detection

全部详细技术资料下载

【技术实现步骤摘要】
一种面向小目标检测的网络和困难样本挖掘方法
本专利技术涉及小目标检测问题，更具体地，涉及一种面向小目标检测的网络和困难样本挖掘方法。
技术介绍
受益于卓越的灵活性和便携性，无人机航拍广泛应用于农业、影视、测绘、监控、快递、户外搜救等领域。航拍数据的自动处理和智能识别成为了业界的迫切需求。作为其中关键技术之一，无人机目标检测成为了当下的研究热点。尽管深度学习方法在通用目标检测领域获得了巨大的成功，它们在无人机航拍场景下的表现不尽人意。不同于普通图像，无人机航拍图像面临严重的小目标挑战：更多的小目标、更低的目标平均分辨率和更小的ORS。下文对比性分析了COCO、ImageNet和VisDrone数据集(一个近期提出的大型无人机航拍数据集)，进一步阐述这三个方面。无人机航拍场景下小目标占比更重。统计了COCO2014和VisDrone2018训练集中的目标像素面积分布，VisDrone2018中约有60％的目标面积不超过1000像素，约75％的目标面积不超过2000像素。而COCO中这样的目标分别只有约40％和55％。由此可见，无人机航拍场景下有更多的小目标，其目标检测的核心在于小目标检测。无人机航拍图像中目标的平均分辨率也更低。COCO2014中目标平均面积为2.05e+4像素。而VisDrone2018中目标平均面积仅为2.49e+3像素，是COCO2014的1/8。更低的分辨率意味着目标携带的外观信息更少、信噪比更低，更难被检测器检出。除绝对尺度外，航拍图像中目标的相对尺度也较小。在检...

【技术保护点】
1.一种面向小目标检测的网络和困难样本挖掘方法，其特征在于，包括以下步骤：/n步骤一、使用主干网络提取当前图像主干特征；/n步骤二、构造颈部网络，生成特征金字塔；/n步骤三、构造区域生成网络，生成感兴趣区域；/n步骤四、基于困难样本挖掘生成训练数据；/n步骤五、使用感兴趣区域对齐模块裁剪区域特征；/n步骤六、使用头部网络分类和定位目标，最后输出检测结果。/n

【技术特征摘要】
1.一种面向小目标检测的网络和困难样本挖掘方法，其特征在于，包括以下步骤：
步骤一、使用主干网络提取当前图像主干特征；
步骤二、构造颈部网络，生成特征金字塔；
步骤三、构造区域生成网络，生成感兴趣区域；
步骤四、基于困难样本挖掘生成训练数据；
步骤五、使用感兴趣区域对齐模块裁剪区域特征；
步骤六、使用头部网络分类和定位目标，最后输出检测结果。

2.根据权利要求1所述的一种面向小目标检测的网络和困难样本挖掘方法，其特征在于，步骤一所述的主干网络为50层的残差网络，该残差网络包含五阶，每一阶由若干个残差模块串联而成，特征尺寸相同，相邻各阶之间存在2倍下采样层，下采样后特征尺寸缩小两倍；最终提取的主干特征为主干网络二阶至五阶每阶最后一张特征图的集合。

3.根据权利要求1所述的一种面向小目标检测的网络和困难样本挖掘方法，其特征在于，步骤二所述的颈部网络主要由三组结构相同的稠密连接串联而成；第一组稠密连接输入主干特征，生成对应的第一级特征金字塔；第二组稠密连接输入第一级特征金字塔，生成对应的第二级特征金字塔；第三组稠密连接输入第二级特征金字塔，生成择重小尺度目标的第三级特征金字塔；
所述特征金字塔包括若干种尺寸特征；所述择重小尺度目标是指特征金字塔偏向表征小目标。

4.根据权利要求3所述的一种面向小目标检测的网络和困难样本挖掘方法，其特征在于，所述稠密连接包含10个相同的特征融合连接，稠密连接具体如下：
对颈部网络输入特征金字塔的五阶特征连接输出特征金字塔的二阶至五阶特征，输入特征金字塔的四阶特征连接输出特征金字塔的二阶至四阶特征，输入特征金字塔的三阶特征连接输出特征金字塔的二阶和三阶特征，输入特征金字塔的二阶特征连接输出特征金字塔的二阶特征。

5.根据权利要求4所述的一种面向小目标检测的网络和困难样本挖掘方法，其特征在于，所述特征融合连接的实现包括以下步骤：
第一步、使用最近邻上采样层将高阶特征放大至低阶特征的尺寸；
第二步、将缩放后的高阶特征与低阶特征元素相加；
第三步、使用2个步长为1，补零填充为1的3*3卷积层处理第二步相加所得的特征。

6.根据权利要求1...

【专利技术属性】
技术研发人员：周靖凯，刘琼，
申请(专利权)人：华南理工大学，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人