本发明专利技术公开了一种用于图片小目标的检测方法,通过以待检测图片作为目标检测网络的输入,从待检测图片中获取六个不同尺寸的特征图,采用双线性插值法将六个不同尺寸的特征图中的金字塔的底层特征图与金字塔的高层特征图进行特征融合得到新的六个不同尺寸的特征图,考虑各尺度特征图之间的关系,使参与预测的特征图有更丰富的细节信息和语义信息,使用预先训练模型的默认设置对目标检测网络进行训练,并采用随机梯度下降算法对损失函数式进行优化训练,有利于模型的快速收敛,利用训练好的目标检测网络进行测试,对待检测的图像特征提取,能够有效提高图片小目标的检测精度和检测速度,可在完全满足实时性条件下有效提高小目标的检测精度。
【技术实现步骤摘要】
一种用于图片小目标的检测方法
本专利技术属于目标检测领域,具体涉及一种用于图片小目标的检测方法。
技术介绍
目标检测是计算机视觉领域的核心问题之一,是计算机视觉中一个重要的研究方向。随着计算机视觉的飞速发展,目标检测被广泛应用于智能交通、医学图像诊断、图像检索以及军事应用等领域。传统的目标检测算法一般可以分为三个阶段:区域选择,特征提取,分类器分类。区域选择多采用滑动窗口的策略对整幅图像进行遍历,而窗口需要设置不同的尺度,不同的长宽比。这种穷举的策略虽然包含了目标所有可能出现的位置,但耗时过长,窗口冗余度高,花费成本高。由于目标的形态、背景、光照变化的多样性等因素使得设计一个鲁棒的特征非常困难,然而提取特征的好坏直接影响到分类的准确性,常用的图像特征有梯度方向直方图(HistogramofOrientedGradients,HOG)、尺度不变特征转换(ScaleInvariantFeatureTransform,SIFT)等。常用的分类器有支持向量机(SupportVectorMachine,SVM)、迭代器(AdaBoost)以及各种级联分类器。这些共同组成了丰富的目标检测算法。传统的目标检测算法存在很大的不足之处:1、基于滑动窗口的区域选择策略没有针对性,时间复杂度高,窗口冗余;2、手工设计的特征对于多样性的变化没有很好的鲁棒性。因此,传统方法已经无法满足当前人们对于实时精度的要求,而卷积神经网络凭借着强大的计算能力,良好的检测效果和性能等特点迅速成为目标检测的发展新思路。自2012年神经网络在ImageNet图像分类比赛中取得巨大成功后,整个学术界和工业界都在利用神经网络做目标检测的研究,使基于深度学习的目标检测逐渐应用于图像目标检测领域并不断取得重大突破。目前流行的算法可分为两类:基于候选区域的two-stage检测算法和基于回归的One-stage检测算法。Two-stage检测算法包括R-CNN(Region-CNN),FastR-CNN,FasterR-CNN等,该算法在特征图上对可能存在的目标的位置提取候选区域框,并对提取到的特征进行分类和位置回归。One-stage检测算法包括SSD、YOLO系列等。该算法去除候选区域这一步骤,直接以整张图片作为网络的输入,并在输出层回归边界框位置及其所属类别,实现了端到端的训练方式。虽然基于候选区域的two-stage检测算法的精度很高,但是其速度无法满足实时需求。而基于回归的One-stage检测算法的检测速度大大提升,但精度略低,尤其是针对小目标。SSD算法在一个网格中设置多个候选区域,并采用多尺度金字塔进行边界框提取,兼顾检测的准确率和速度。但由于SSD的检测模型只有底层的conv4_3用于检测小目标,不具有足够的语义信息,同时未考虑到不同尺寸特征图之间的关系,导致对小目标的检测性能较差,因此仍需要探索提高小目标的检测精度的新途径。
技术实现思路
本专利技术的目的在于提供一种用于图片小目标的检测方法,以克服现有技术的不足。为达到上述目的,本专利技术采用如下技术方案:一种用于图片小目标的检测方法,包括以下步骤:步骤1)、构建用于图片小目标检测的目标检测网络,以待检测图片作为目标检测网络的输入,从待检测图片中获取六个不同尺寸的特征图,采用双线性插值法将六个不同尺寸的特征图中的金字塔的底层特征图与金字塔的高层特征图进行特征融合得到新的六个不同尺寸的特征图,以新的六个不同尺寸的特征图参与预测;步骤2)、使用预先训练模型的默认设置对目标检测网络进行训练,并采用随机梯度下降算法对损失函数式进行优化训练,直至达到最大迭代次数,完成目标检测网络的训练;步骤3)、利用训练好的目标检测网络进行测试,对待检测的图像特征提取,预测各目标的位置和类别,输出带有类别标记的图片。进一步的,在特征融合时,利用1×1的卷积改变六个不同尺寸的特征图的通道数,将底层特征图与高层特征图以2:1的权重比例进行融合。进一步的,将新的六个不同尺寸的特征图由金字塔的底层特征图至金字塔的高层特征图的先验框数目分别调整为9、6、6、6、4和4。进一步的,取先验框尺寸相对原图片的比例的最大值和最小值分别为0.9和0.1。进一步的,目标网络的损失函数为:L(x,c,l,g)=Lconf(x,c)+Lloc(x,c,g)+βL2loss其中,x表示默认框和预测框是否成功匹配;c表示置信度;l表示预测框的位置信息;g表示真实框的位置信息;Lconf(x,c)表示为分类损失函数,采用SoftmaxLoss1;Lloc(x,l,g)为位置损失,采用SmoothL1;α为权值系数,用于调整ConfidenceLoss和LocationLoss之间的比例关系,本文设定为1;β为L2正则化因子,此处取值0.1保证惩罚值与原损失相当。定位损失函数表示为:其中当时表示第i个先验框与第j个真实框相匹配,并且类别为k,否则为0;Npos表示正样例集合;(cx,cy,w,h)分别表示边界框中心像素坐标以及宽高;为编码后的真实框位置参数;表示先验框的预测值;表示平滑L1范数,l表示预测框,g表示真实框,d表示先验框;函数表示为:分类损失函数为:其中,i∈Pos和i∈Neg分别表示第i个正样本预测框和第i个负样本预测框。进一步的,对目标检测网络进行训练的网络超参数为:动量参数为0.9,衰减系数为0.0005,最大迭代次数为120000次,批量大小为32,初始化学习率为ηlr=0.001。进一步的,学习率设置为:0到1k为10-4,1K到80k为10-3,80k到100k为10-4,100k到120k为10-5。与现有技术相比,本专利技术具有以下有益的技术效果:本专利技术一种用于图片小目标的检测方法,通过以待检测图片作为目标检测网络的输入,从待检测图片中获取六个不同尺寸的特征图,采用双线性插值法将六个不同尺寸的特征图中的金字塔的底层特征图与金字塔的高层特征图进行特征融合得到新的六个不同尺寸的特征图,考虑各尺度特征图之间的关系,使参与预测的特征图有更丰富的细节信息和语义信息,使用预先训练模型的默认设置对目标检测网络进行训练,并采用随机梯度下降算法对损失函数式进行优化训练,有利于模型的快速收敛,利用训练好的目标检测网络进行测试,对待检测的图像特征提取,能够有效提高图片小目标的检测精度和检测速度,从实验结果可以看出,本专利技术针对小目标检测具有较好的性能表现,可在完全满足实时性条件下有效提高小目标的检测精度。进一步的,在特征融合时,利用卷积改变特征图的通道数,将底层与高层特征图以2:1的权重比例进行融合,使特征图中描述底层特征图的特征数增加,小目标的细节信息更加丰富。进一步的,调整特征图上设置的先验框数目,以及先验框大小相对于图片的比例,使改进的网络模型更能适用于小目标的检测。附图说明图1为本专利技术实施例中检测方法流程图。图2为本专利技术实施例中本文档来自技高网...
【技术保护点】
1.一种用于图片小目标的检测方法,其特征在于,包括以下步骤:/n步骤1)、构建用于图片小目标检测的目标检测网络,以待检测图片作为目标检测网络的输入,从待检测图片中获取六个不同尺寸的特征图,采用双线性插值法将六个不同尺寸的特征图中的金字塔的底层特征图与金字塔的高层特征图进行特征融合得到新的六个不同尺寸的特征图,以新的六个不同尺寸的特征图参与预测;/n步骤2)、使用预先训练模型的默认设置对目标检测网络进行训练,并采用随机梯度下降算法对损失函数式进行优化训练,直至达到最大迭代次数,完成目标检测网络的训练;/n步骤3)、利用训练好的目标检测网络进行测试,对待检测的图像特征提取,预测各目标的位置和类别,输出带有类别标记的图片。/n
【技术特征摘要】
1.一种用于图片小目标的检测方法,其特征在于,包括以下步骤:
步骤1)、构建用于图片小目标检测的目标检测网络,以待检测图片作为目标检测网络的输入,从待检测图片中获取六个不同尺寸的特征图,采用双线性插值法将六个不同尺寸的特征图中的金字塔的底层特征图与金字塔的高层特征图进行特征融合得到新的六个不同尺寸的特征图,以新的六个不同尺寸的特征图参与预测;
步骤2)、使用预先训练模型的默认设置对目标检测网络进行训练,并采用随机梯度下降算法对损失函数式进行优化训练,直至达到最大迭代次数,完成目标检测网络的训练;
步骤3)、利用训练好的目标检测网络进行测试,对待检测的图像特征提取,预测各目标的位置和类别,输出带有类别标记的图片。
2.根据权利要求1所述的一种用于图片小目标的检测方法,其特征在于,在特征融合时,利用1×1的卷积改变六个不同尺寸的特征图的通道数,将底层特征图与高层特征图以2:1的权重比例进行融合。
3.根据权利要求1所述的一种用于图片小目标的检测方法,其特征在于,将新的六个不同尺寸的特征图由金字塔的底层特征图至金字塔的高层特征图的先验框数目分别调整为9、6、6、6、4和4。
4.根据权利要求3所述的一种用于图片小目标的检测方法,其特征在于,取先验框尺寸相对原图片的比例的最大值和最小值分别为0.9和0.1。
5.根据权利要求1所述的一种用于图片小目标的检测方法,其特征在于,目标网络的损失函数为:
L(x,c,l,g)=Lconf(x,c)+Lloc(x,c,g)+βL2l...
【专利技术属性】
技术研发人员:陈婷,张亚南,高涛,李永会,姚大春,王松涛,
申请(专利权)人:长安大学,
类型:发明
国别省市:陕西;61
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。