一种基于特征复用与YOLOv3的目标检测方法技术

技术编号:23400565 阅读:10 留言:0更新日期:2020-02-22 12:46
本发明专利技术实施例公开一种基于特征复用与YOLOv3的目标检测方法。本发明专利技术实施例所提供的基于YOLOv3的目标检测方法包括步骤:提出多个卷积层的小参数卷积神经网络;在提出的卷积神经网络上应用密集相连模块进行改进,并提出使用最大池化加强密集连接模块间的特征传递;针对目标为小目标的情况,提出将YOLOv3的3个尺度检测增加至4个并以密集相连融合不同尺度模块特征层的信息;在目标测试集上进行训练和测试。通过实验表明,本发明专利技术实施例所提供的基于YOLOv3的目标检测方法不仅具有很高的召回率,还能够平衡精确性和实时性的需求。

A method of target detection based on feature reuse and yolov3

【技术实现步骤摘要】
一种基于特征复用与YOLOv3的目标检测方法
本专利技术涉计算机视觉的
,具体涉及一种基于特征复用与YOLOv3的目标检测方法。
技术介绍
在军事领域中,遥感图像中飞机目标的检测有着重要的需求。针对遥感图像中的飞机的实时监测,在现代化战争中可以带来极大的优势。由于遥感图像中存在背景斑杂、光照变化等严重影响分类器性能的因素,在传统的机器学习框架中遥感图像中的飞机目标难以被准确高效的检测。近几年来,基于深度学习的目标检测方法得到了很大的突破,其主要的方法可以分为两类。一类是基于区域推荐的目标检测方法,该方法的处理过程一般为首先使用区域推荐产生候选目标,随后使用卷积神经网络进行处理;具有代表性的方法有RCNN、FastRCNN、FasterRCNN、MaskRCNN等。该方法的精度较高,但是不能满足实时应用的需求。另一类是基于回归方法的目标检测算法,该方法的处理思想为将检测问题作为回归问题处理,直接预测目标位置与类别;具有代表性的算法有YOLO、SSD、YOLOv2、YOLOv3等。该类方法的速度快,但是相对而言精度偏低。由于使用卷积神经网络提取的特征的泛化性远高于传统的人工特征,基于卷积神经网络的目标检测方法被迅速推广应用到各个领域,如图像分类、农业、自动驾驶、零件检测、军事领域等。薛月菊等人在YOLOv2-tiny的基础上,结合密集连接,提出了一种用于识别未成熟芒果的方法。王思雨等人基于LeNet5改进提出了一种基于卷积神经网络的合成孔径图像中的飞机目标检测方法。周敏等人设计了一个包含8种飞机的数据集和一个5层的卷积神经网络用于飞机分类,相对于传统的机器学习方法有很大的提高。虽然目前针对遥感图像中的飞机目标检测有很多方法,但是上述方法无法较好地平衡实时性与精确性的需求。进一步地,基于YOLOv3-tiny的检测方法存在召回率低的问题,基于YOLOv3的检测方法存在参数量过大的问题。因此,针对现有的针对遥感图像中飞机目标的检测方法所存在的问题,需要提供一种能够很好地平衡实时性需求和精确性需求且能同时解决召回率低和参数量过大的问题的一种基于特征复用与YOLOv3的目标检测方法。
技术实现思路
针对现有的遥感图像中飞机目标的检测方法所存在的问题,本专利技术实施例提出一种基于特征复用与YOLOv3的目标检测方法。该目标检测方法不仅能解决现有检测方法中的召回率低和参数量过大的问题,而且能够很好地平衡实时性需求和精确性需求。该基于特征复用与YOLOv3的目标检测方法的具体方案如下:本专利技术实施例所提供的基于特征复用与YOLOv3的目标检测方法的包括步骤一:将所需进行识别的图像分为训练样本、测试样本和验证样本,读取训练样本的数据并采用聚类方法计算出多个锚点框;步骤二:搭建用于检测的卷积神经网络的网络结构Darknet49-Dense;步骤三:在网络结构Darknet49-Dense的基础上,应用YOLOv3并扩展多尺度的模块;步骤四:将训练样本缩放至预设大小,并将缩放后的训练样本放入步骤二所搭建的网络结构中进行训练,训练过程包括前向传播和反向传播,并且每隔预设次数迭代保存一次模型;步骤五:当损失下降到预设程度后,将验证样本缩放至预设大小并将缩放后的验证样本放入步骤五中所述的模型中进行验证,若验证样本的测试结果达到最优,则取当前模型为最优模型;步骤六:使用训练后的模型的参数对缩放后的测试样本进行检测,获得图像的检测结果和算法性能参数;采用最优模型对所需检测的图像进行检测,获得目标检测结果。优选地,所述步骤四中所述的预设大小为416×416。优选地,所述步骤一中采用K-means聚类法计算出12个锚点框。优选地,所述网络结构Darknet49-Dense包括4个密集相连模块和3个过渡模块,所述每个密集相连模块之间具有一个所述的过渡模块,所述过渡模块用于将特征图的尺寸降低。优选地,所述密集相连模块包括4个1×1卷积核和3×3卷积核;所述过渡模块包括一个1×1卷积核和一个步长为2的3×3卷积核,并且将其输出与步长为2的最大池化的输出拼接后,作为下一个密集模块的输入。优选地,所述YOLOv3包括4个特征图尺度,所述4个特征图尺度为13×13,26×26,52×52,104×104。优选地,步骤四的具体过程包括:采用的动量为0.9,使用随机梯度下降进行优化,初始学习率为lr=0.001,衰减系数设置为0.005,前1000批次训练中采用学习率为learning_rate=lr*(batch/1000)2以稳定网络,batch为当前的批次数,随后学习率为10-3。优选地,在步骤四训练过程中,每经10次训练就随机选择新的图片尺寸进行训练,所述图片的尺寸范围为从320×320到608×608。优选地,所述前向传播具体为:输入样本从输入层进入网络,通过上一层的结点以及对应的连接权值进行加权和运算,在结果上加上一个偏置项,最后再通过激活函数得到的结果就是本层结点的输出,最终不断的通过这种方法逐层运算,得到输出层结果;如果输出层的实际输出与期望输出不同,则转至误差反向传播。优选地,所述后向传播具体为:将误差按原路反向计算,在反向过程中通过链式法则将误差分摊给各层的各个单元,获得各层各单元的误差信号,使用梯度下降不停地调整各层神经元的权值,使损失减小到最低限度。从以上技术方案可以看出,本专利技术实施例具有以下优点:本专利技术实施例提供一种基于特征复用与YOLOv3的目标检测方法通过设计和搭建一个卷积神经网络,解决了现有的YOLOv3-tiny目标检测方法的召回率低而YOLOv3目标检测方法的参数量过大的问题。进一步地,本专利技术实施例提供一种基于特征复用与YOLOv3的目标检测方法通过采用密集相连模块增强卷积神经网络层间连接,并通过密集模块间的最大池化进行下采样进一步加强密集神经网络区块间的连接,有效地解决了深度神经网络的退化问题,有效地增强了特征的复用。进一步地,本专利技术实施例提供一种基于特征复用与YOLOv3的目标检测方法通过将原有的YOLOv3中的3个尺度检测扩展为4个尺度检测,从而增大了检测遥感图像中的飞机小目标的准确率;其次参照密集神经网络,该方法对4个尺度的检测网络使用密集相连,从而提高YOLOv3的多尺度检测的准确率。附图说明图1为本专利技术实施例中提供的一种基于特征复用与YOLOv3的目标检测方法的流程示意图;图2为图1所示实施例中尺度为13x13的单元格中的预测边界框示意图;图3(a)为神经网络结构Darknet49的示意图;图3(b)为神经网络结构Darknet49-Dense的示意图;图4为图1所示实施例中的模块间密集连接的图解示意图;图5为图1所示实施例中的密集相连的多尺度检测示意图;图6(a)至图6(f)为本专利技术实施例所提供的目标检测方法(简称YOLOv3-air)与YOLOv3-tiny目标检测方法、YOLOv3目标检测方法在不同图像中的定性对比图。具本文档来自技高网
...

【技术保护点】
1.一种基于特征复用与YOLOv3的目标检测方法,其特征在于,所述目标检测方法的步骤包括:/n步骤一:将所需进行识别的图像分为训练样本、测试样本和验证样本,读取训练样本的数据并采用聚类方法计算出多个锚点框;/n步骤二:搭建用于检测的卷积神经网络的网络结构Darknet49-Dense;/n步骤三:在网络结构Darknet49-Dense的基础上,应用YOLOv3并扩展多尺度的模块;/n步骤四:将训练样本缩放至预设大小,并将缩放后的训练样本放入步骤二所搭建的网络结构中进行训练,训练过程包括前向传播和反向传播,并且每隔预设次数迭代保存一次模型;/n步骤五:当损失下降到预设程度后,将验证样本缩放至预设大小并将缩放后的验证样本放入步骤五中所述的模型中进行验证,若验证样本的测试结果达到最优,则取当前模型为最优模型;/n步骤六:使用训练后的模型的参数对缩放后的测试样本进行检测,获得图像的检测结果和算法性能参数;采用最优模型对所需检测的图像进行检测,获得目标检测结果。/n

【技术特征摘要】
1.一种基于特征复用与YOLOv3的目标检测方法,其特征在于,所述目标检测方法的步骤包括:
步骤一:将所需进行识别的图像分为训练样本、测试样本和验证样本,读取训练样本的数据并采用聚类方法计算出多个锚点框;
步骤二:搭建用于检测的卷积神经网络的网络结构Darknet49-Dense;
步骤三:在网络结构Darknet49-Dense的基础上,应用YOLOv3并扩展多尺度的模块;
步骤四:将训练样本缩放至预设大小,并将缩放后的训练样本放入步骤二所搭建的网络结构中进行训练,训练过程包括前向传播和反向传播,并且每隔预设次数迭代保存一次模型;
步骤五:当损失下降到预设程度后,将验证样本缩放至预设大小并将缩放后的验证样本放入步骤五中所述的模型中进行验证,若验证样本的测试结果达到最优,则取当前模型为最优模型;
步骤六:使用训练后的模型的参数对缩放后的测试样本进行检测,获得图像的检测结果和算法性能参数;采用最优模型对所需检测的图像进行检测,获得目标检测结果。


2.根据权利要求1所述的一种基于特征复用与YOLOv3的目标检测方法,其特征在于,所述步骤四中所述的预设大小为416×416。


3.根据权利要求1所述的一种基于特征复用与YOLOv3的目标检测方法,其特征在于,所述步骤一中采用K-means聚类法计算出12个锚点框。


4.根据权利要求1所述的一种基于特征复用与YOLOv3的目标检测方法,其特征在于,所述网络结构Darknet49-Dense包括4个密集相连模块和3个过渡模块,所述每个密集相连模块之间具有一个所述的过渡模块,所述过渡模块用于将特征图的尺寸降低。


5.根据权利要求4所述的一种基于特征复用与YOLOv3的目标检测方法,其特征在于,所述密集相连模块包括4个1×1卷积核和3×3卷积...

【专利技术属性】
技术研发人员:戴伟聪金龙旭李国宁
申请(专利权)人:中国科学院长春光学精密机械与物理研究所
类型:发明
国别省市:吉林;22

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1