【技术实现步骤摘要】
一种基于注意力机制的小目标检测方法
[0001]本专利技术属于生物特征认证
,涉及一种基于注意力机制的小目标检测方法。
技术介绍
[0002]目标检测也是计算机视觉四大基本任务中的一个,有着十分广阔的应用前景。目标检测技术在军事和民用领域都有着的极大的应用价值,如在机场、火车站、港口、无人机对地侦测等重要场合下,以及视频监控、人脸识别、智能交通等方面都有应用,并且取得了不错的效果,同时也为图像分析、理解和行为识别等任务提供技术基础。但是该技术还不是完美的,存在着一些难以解决的问题,如小目标难以检测的问题。这个问题在日常生活中普遍存在,如监控视频中的比较小的车辆和行人、自动驾驶中需要远距离识别行人和车辆、卫星图中的众多小目标等。小目标通常是由于场景中待检测目标距离摄像头较远或者实际物理尺寸较小从而导致目标在图片中的像素占比少。因此,在目标检测过程中,由于不同尺寸目标其特征表征能力的不同,从而导致多尺度特征学习困难,最终造成小尺寸目标检测精度较低甚至产生大量漏检的现象。目前对于这些小目标的检测效果完全不能应用到日常生活和工业生产中,还需要极大的提升才能够得到应用。正是基于这样的发展背景,对于小尺寸目标的检测一直是目标检测任务中一个极具挑战且重要的分支。
[0003]小目标检测技术是在给定的图像上判断是否有小目标,并且要标注出小目标的位置,一般使用矩形框进行标注,小目标的检测在自动驾驶、医学检测、工业生产、卫星遥感以及刑侦等领域中都有着广泛且重要的应用。在自动驾驶领域,汽车常常通过摄像头等装置采集到的高分辨率 ...
【技术保护点】
【技术特征摘要】
1.一种基于注意力机制的小目标检测方法,其特征在于:该方法具体包括以下步骤:步骤1、使用目标检测数据集以及自己标注图像数据相结合的方法,构建小目标检测数据集,对数据集中的图像进行预处理,然后按照设定比例划分为训练集、测试集以及验证集;步骤2、构建卷积神经网络的网络结构,包括特征提取网络、特征融合网络以及小目标预测网络,并对参数进行初始化;使用改进型Resnet网络作为特征提取网络,将Resnet网络的Bottle Net网络架构分解成多个均匀的分支结构;特征融合网络采用一种基于通道和空间注意力的模块即CBAM模块,将CBAM模块嵌入到特征金字塔网络FPN中进行多尺度预测,对多层间的信息进行融合;步骤3、将训练集中的训练样本输入到初始化的卷积神经网络中,根据网络传播流程计算出各部分损失,并根据损失来调整各个参数,从而得到最佳的网络参数;然后在测试集合中进行测试,以及在验证集合中进行验证,最终得到训练好的神经网络模型;步骤4、利用训练好的深度卷积神经网络模型检测图像中的小目标,得到小目标检测框、分类以及置信度信息并在图像中标注出来。2.根据权利要求1所述的基于注意力机制的小目标检测方法,其特征在于,所述步骤1,具体包括以下步骤:(1.1)获取目标检测图像,构建小目标检测数据集:收集COCO数据集中的小目标对象的图像数据来构建小目标检测数据集;(1.2)对小目标检测数据集进行预处理:对采集获取的图像数据进行处理,包括放缩、填充处理和归一化;归一化是指将图像数据格式转换为统一的图像数据格式,以及采用归一化公式对图像样本中的每一个像素点进行归一化;(1.3)划分训练集、测试集和验证集:根据数据集的大小通过不同的方式进行划分,如果当数据量不大于一万的时候将训练集、验证集以及测试集划分为3:1:1;若是数据量大于一万,将训练集、验证集、测试集的比例调整为98:1:1。3.根据权利要求1所述的基于注意力机制的小目标检测方法,其特征在于,所述步骤2,具体包括以下步骤:(2.1)构建特征提取网络,该特征提取网络对输入图像的深、浅层语义特征低进行提取;(2.2)构建特征融合网络,将特征提取网络获得的深层语义信息进行上采样,然后和浅层的细节信息进行融合,获得最终的特征图;(2.3)构建小目标预测网络,小目标预测网络分为两部分,一是回归任务模块,用于对目标框进行定位,另一个是分类模块,用于对目标框进行目标分类;特征融合网络得到的特征图作为输入,小目标检测网络通过这些特征获得最终的检测结果。4.根据权利要求3所述的基于注意力机制的小目标检测方法,其特征在于,步骤(2.1)所述构建特征提取网络,具体如下:特征提取网络使用改进的Resnet网络,整个特征提取网络由多个残差模块构成,传统残差模块的前向传播公式如下:y=F(x,w)+x
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
其中x,y分别为输入和输出,F(x,w)为一般神经网络前向传播公式,w为传播相关参数;将Resnet网络的BottleNet网络架构分解成多个均匀的分支结构,参考深度可分离卷积,并利用分组卷积,通过变量基数来控制组的数量,即每个分支产生的特征图的通道数为n,n>1;则残差模块的前向传播公式为:其中x,y分别为输入和输出,F(x,w
i
)为各个分支的神经网络前向传播公式,w
i
为各个分支传播相关参数,也就是网络中需要训练的参数;特征提取网络还包括卷积模块和池化模块:卷积模块的目的是提取图像的特征,根据不同的卷积核、不同的计算方式,得到不同的特征提取图;池化模块夹在连续的卷积模块中间,用于压缩数据和参数的量;将上述的卷积模块、池化模块以及改进残差模块,按照表1格式构建特征提取网络,其中conv1、conv2_x、conv3_x、conv4_x、conv5_x分别表示五个由多个卷积层组成的模块,max pooling表示最大值池化,stride为池化步长;表1如表1所示,特征提取网络共有49层卷积神经网络层,还有一层最大池化层。5.根据权利要求3所述的基于注意力机制的小目标检测方法,其特征在于,步骤(2.2)所述构建特征融合网络,具体如下:
①
在特征融合的过程中使用双线性插值的上采样方法,双线性插值就是做两次线性变
换,先在X轴上做一次线性变换,求出每一行的R点:再通过一次线性变换求出在该区域中的P点:其中(x,y)表示待插入位置,P
11
,P
12
,P
21
,P
22
分别是双线性插值法中待插入位置4个角点,其坐标分别为(x1,y1),(x1,y2),(x2,y1),(x2,y2),f(
·
)表示
·
处的像素值,T1为P
11
与P
21
的中点,T2为P
11
与P
22
的中点;
②
在进行特征图融合时,采用一种基于通道和空间注意力的模块,称为CBAM模块,CBA...
【专利技术属性】
技术研发人员:李军,刘杰强,李臣岳,张书恒,张礼轩,
申请(专利权)人:南京理工大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。