一种轻量化的目标检测方法技术

技术编号:37118871 阅读:30 留言:0更新日期:2023-04-01 05:13
本发明专利技术公开一种轻量化的目标检测方法,是基于YOLOv3改进的目标检测算法,采取GhostNet中的卷积可分离操作(DW)的思想,用Ghost Module替代Conv2d,将多通道数据分成多组同时进行处理,达到减少网络参数的目的;在原网络中三层特征输出层的基础上添加一层特征输出层,用k

【技术实现步骤摘要】
一种轻量化的目标检测方法


[0001]本专利技术属于智能机器学习领域,具体说是一种基于YOLOv3改进的轻量化目标检测算法。

技术介绍

[0002]目标检测对于人类来说,是一项非常简单的任务,就连几个月大的婴儿都能识别出一些常见目标。但是起初,让机器学会目标检测仍是一个艰巨的任务。目标检测需要识别并定位视野中某个目标的所有实例,与其他的类似任务,如分类、分割、运动估计、场景理解等,一同构成了计算机视觉领域的基础问题。目前,目标检测是计算机视觉和数字图像处理的一个热门方向,广泛应用于机器人导航、智能视频监控、工业检测、航空航天等诸多领域,通过计算机视觉减少对人力资本的消耗,具有重要的现实意义。因此,目标检测也就成为了近年来理论和应用的研究热点,它是图像处理和计算机视觉学科的重要分支,也是智能监控系统的核心部分,同时目标检测也是泛身份识别领域的一个基础性的算法,对后续的人脸识别、步态识别、人群计数、实例分割等任务起着至关重要的作用。
[0003]对于巡检机器人针对工作环境,对人体和大型动物进行目标识别,现有的目标检测方法有传统检测方法和基于深度学习的检测方法。传统的目标检测算法可以概括为以下几个步骤:首先,采取滑动窗口的方式遍历整张图像,产生一定数量的候选框;其次,提取候选框的特征;最后,利用支持向量机(SVM)等分类方法对提取到的特征进行分类,进而得到结果。由于当时缺乏有效的图像表示,人们只能设计复杂的特征表示,并通过各种加速技能来充分利用有限的计算资源。主要的方式是人工提取,具有一定的局限性,手工特征的性能也趋于饱和。传统的目标检测算法只适应于有明显特征,背景简单的情形。2012年起,卷积神经网络的广泛应用使得目标检测也开启了新的征程。2014年R

CNN算法横空出世,目标检测开始以前所未有的速度快速发展,步入深度学习时代。在实际的应用中,背景复杂多变,而且待检测的目标复杂多变,很难通过一般的抽象特征完成对目标的检测,而深度学习利用庞大丰富的数据,对模型进行训练,从而使得算法的泛化力更强,更容易应用于实际场景。在当前的应用中,机器人的工作环境比较特殊,多是灌木草丛,对目标识别又很大的影响,会导致识别不准确或者丢失目标物;在机器人的处理器中需要处理多种数据,在计算量上需要尽可能压缩,而原YOLOv3网络参数计算量太大,检测小目标物存在丢失现象,所以在原有的网络中,进行优化,实现参数量的减少和增加该环境下的目标精确识别。

技术实现思路

[0004]本专利技术公开一种轻量化的目标检测方法,是基于YOLOv3改进的目标检测算法,采取GhostNet中的卷积可分离操作(DW)的思想,用Ghost Module替代Conv2d,将多通道数据分成多组同时进行处理,达到减少网络参数的目的;在原网络中三层特征输出层的基础上添加一层特征输出层,用k

means算法计算新的anchors尺寸,用来识别更小目标物;将原有的IoU计算方法更进为DIoU计算方式,增加惩罚项,在网络训练的过程中,让生成的预选框
回归速度更快,效果更好。本专利技术在保证YOLOv3网络特征提取精确度的前提下,缩减模型的计算量,提高检测速度。
[0005]YOLOv3的检测分两步:确定检测对象的位置,对检测对象分类。改进后的YOLOv3详细步骤如下:第一步,YOLOv3提取多特征层进行目标检测,一共提取四层,采用FPN进行特征融合。第二步,预测结果的解码,计算出最后显示的边界框的坐标以及宽高,得出边界框位置。第三步,对预测出的边界框得分排序与非极大抑制的筛选,取出每一类得分大于一定阈值的框和得分进行排序,利用框的位置和得分进行非极大抑制。最后可以得出概率最大的边界框,也就是最后显示出的框。
[0006]本专利技术为实现上述目的所采用的技术方案是:一种轻量化的目标检测方法,包括以下步骤:
[0007]对机器人采集的图片进行预处理;
[0008]经过预处理的图片进入YOLOv3网络的骨干层进行特征的提取,依次经颈部层、预测层,得到目标所属类别以及预测框的位置和大小。其中,类别为包含人体、动物的生物体分类。
[0009]所述对获取的图片进行预处理,具体为:将图片的尺寸改为416*416,图像居中,空白部分由灰色填充。
[0010]所述骨干层为Ghost_Darknet

53网络。
[0011]所述骨干层,采用Ghost Module替换原Darknet

53网络中的Conv2d卷积层。
[0012]所述Ghost Module中,首先1*1的卷积层对输入图片进行通道数的压缩,然后再使用3*3的卷积层进行深度可分离卷积得到更多的特征图,将不同的特征图堆叠到一起,组成新的输出,再与输入相加;得到的结果作为一下层网络的输入。
[0013]所述进入YOLOv3网络的骨干层进行特征的提取,包括以下步骤:
[0014]首先要经过一个卷积层、BN归一化和激活操作,再经过五组下采样卷积,每组下采样是由Ghost Module和残差结构组成;每组下采样按照1、2、8、8、4的次数顺序,重复进行特征提取;
[0015]将后四组的输出作为提取出的特征,作为颈部层的输入。
[0016]在颈部层、预测层后添加第四层输出层,使用FPN特征融合,构成改进后的YOLOv3,具体如下:
[0017]颈部层和预测层统称输出层,原输出尺寸大小依次分别为13*13、26*26、52*52,分别用于检测大、中、小三种尺寸的目标物;其中,三种尺寸为相对设定的大、中、小尺寸。
[0018]所述第四层输出层尺寸为104*104,融合52*52的特征,用于检测比52*52更小的目标。
[0019]使用k

means聚类算法,用数据集的标注文件重新计算先验框的尺寸,包括以下步骤:对训练样本图像集中的多个样本标注框进行聚类,确定训练样本图像集对应的目标YOLOv3预选框。
[0020]将计算预选框和实际框的交并比修改为DIoU,具体包括:
[0021]在原有的交并比IoU计算中,加入预测框和目标框中心欧氏距离、与覆盖预测框和目标框的最小矩形的对角线长度的比值,作为惩罚项,使得在不重叠的情况下,预测框向目标框移动。
[0022]一种轻量化的目标检测系统,包括:
[0023]预处理模块,用于对获取的图片进行预处理;
[0024]分类及检测模块,用于经过预处理的图片进入YOLOv3网络的骨干层进行特征的提取,依次经颈部层、预测层,得到目标所属类别以及预测框的位置和大小。
[0025]本专利技术具有以下有益效果及优点:
[0026]1.本专利技术提供一种基于YOLOv3改进而来的轻量化目标检测方法,在保证提取特征的有效性的前提下减少模型的参数量,增加模型对小物体的识别准确度。
[0027]2.在模型训练的过程中交并比的计算方法更换成DIoU,添加惩罚项,让生成的预选框回归速度更本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种轻量化的目标检测方法,其特征在于,包括以下步骤:对机器人获取的图片进行预处理;经过预处理的图片进入YOLOv3网络的骨干层进行特征的提取,依次经颈部层、预测层,得到目标所属类别以及预测框的位置和大小。2.根据权利要求1所述的一种轻量化的目标检测方法,其特征在于,所述对获取的图片进行预处理,具体为:将图片的尺寸改为416*416,图像居中,空白部分由灰色填充。3.根据权利要求1所述的一种轻量化的目标检测方法,其特征在于,所述骨干层为Ghost_Darknet

53网络。4.根据权利要求3所述的一种轻量化的目标检测方法,其特征在于,所述骨干层,采用Ghost Module替换原Darknet

53网络中的Conv2d卷积层。5.根据权利要求4所述的Ghost Module替换原Darknet

53网络实现方法,其特征在于,所述Ghost Module中,首先1*1的卷积层对输入图片进行通道数的压缩,然后再使用3*3的卷积层进行深度可分离卷积得到更多的特征图,将不同的特征图堆叠到一起,组成新的输出,再与输入相加;得到的结果作为一下层网络的输入。6.根据权利要求1所述的一种轻量化的目标检测方法,其特征在于,所述进入YOLOv3网络的骨干层进行特征的提取,包括以下步骤:首先要经过一个卷积层、BN归一化和激活操作,再经过五组下采样卷积,每组下采样是由Ghost Module和残差结构组...

【专利技术属性】
技术研发人员:郑宇李邦宇
申请(专利权)人:沈阳新松机器人自动化股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1