一种基于深度学习的图像目标快速检测方法技术

技术编号:20867465 阅读:30 留言:0更新日期:2019-04-17 09:32
本发明专利技术公开了一种基于深度学习的图像目标快速检测方法,步骤为:1、建立基于深度学习的第一级Tiny YOLO目标检测模型和第二级Tiny YOLO目标检测模型;2、向第一级Tiny YOLO目标检测模型输入含有目标的测试图像,根据网络输出结果判断检测是否成功;若检测成功,根据检测区域与图像分辨率的关系判断目标是否为小目标;若不是小目标则输出检测结果;若为小目标则进行下一步;若检测失败,对输入的图片进行分块处理,然后对分块处理后的图像进行第一级Tiny YOLO网络检测;3、对第一级Tiny YOLO网络检测输出的检测区域进行放大截取,然后输入至第二级Tiny YOLO网络,进行检测处理,得到输出结果。本发明专利技术处理时间较短,识别可靠性高。

【技术实现步骤摘要】
一种基于深度学习的图像目标快速检测方法
本专利技术属于图像检测识别
,特别涉及一种基于深度学习的图像目标快速检测方法。
技术介绍
图像目标检测一直是图像处理领域的热点,尤其针对小目标的高鲁棒性、高准确性以及高实时性的检测,具有重要的应用价值。本专利技术以软管式自主空中加油的锥套目标检测为例,展开方法的设计与实现。软管式自主空中加油可以大幅度提升无人机的续航能力,它是加油机与受油机通过编队配合,由受油机自主定位前方加油机上锥套相对自身的位置,并通过精准的控制实现受油机与加油锥套的精准对接,其中受油机能够自主准确的定位加油锥套的相对位置尤为关键,为后续的精确控制提供导航信息。目前,软管式自主空中加油近距对接的定位导航手段为视觉导航辅助GPS/INS组合导航,视觉导航负责提供加油锥套与受油机之间的相对位置关系,在导航系统中起到了关键性的作用,而锥套目标的图像检测是视觉导航必不可少的环节,国内外众多研究机构对锥套目标的检测技术开展了大量的研究。软管式自主空中加油对锥套目标的检测提出了很高的要求,一方面,要求锥套目标的检测识别可靠性很高,尤其对于较远距离锥套小目标需要有较高的检测准确率以及成功率;另一方面对于图像信息的处理时间要尽可能短,以保证很高的实时性。目标检测一直是图像处理领域研究的热点。如今,目标检测方法主要分为两大类:基于传统图像处理的目标检测方法和基于深度学习的目标检测方法。传统的目标检测方法可表示为:目标特征提取->目标识别->目标定位。基于深度学习的目标检测可表示为:图像的深度特征提取->基于深度神经网络的目标识别与定位。传统的目标检测算法场景适应性差,对于光照变化剧烈、目标被遮挡、背景干扰严重、目标较小的情况下检测效果较差,因而逐渐被检测精度高、鲁棒性强的深度学习检测算法所取代。基于深度学习的目标检测主要可分为两类:基于区域建议的目标检测与识别算法,如R-CNN、Fast-R-CNN、Faster-R-CNN等;基于回归的目标检测与识别算法,如YOLO、SSD等,其中基于回归的目标检测算法实时性较好。
技术实现思路
专利技术目的:针对现有技术的问题,提供一种处理时间较短,识别可靠性高的基于深度学习的图像目标快速检测方法。技术方案:为解决上述技术问题,本专利技术提供一种基于深度学习的图像目标快速检测方法,包括如下步骤:(1)建立基于深度学习的第一级TinyYOLO目标检测模型和第二级TinyYOLO目标检测模型;(2)向第一级TinyYOLO目标检测模型输入含有目标的测试图像,网络的最后一层输出所有预测目标区域信息R1:R1={ri|ri=(xi,yi,wi,hi,pi,c1i,c2i),i=1,2,...,845}其中ri为第i个预测目标区域,xi为第i个区域左上角点的横坐标,yi为第i个区域左上角点的纵坐标,wi为第i个区域的宽度,hi为第i个区域的高度,pi为第i个区域中含有目标的概率值或置信度,c1i为第i个区域中目标为第一类(近距目标)的概率值,c2i为第i个区域中目标为第二类(远距目标)的概率值,i的取值范围为1~845,由非极大值抑制算法得到置信度最大的目标区域rk:rk=(xk,yk,wk,hk,pk,c1k,c2k)pk=max{pi,i=1,2,...,845}根据目标区域rk的目标置信度pk及目标区域的宽高比判断检测是否成功,判断的条件如下:若检测成功,进行步骤(3);若检测失败,进行步骤(4);(3)根据检测区域与图像分辨率的尺寸关系确定检测区域是否为小目标区域,若为小目标则进行步骤(5),判断为小目标的条件如下所示:W:图像宽度H:图像高度若不是小目标则输出目标区域r:r=(xk,yk,wk,hk)(4)对输入的图片进行分块处理,然后对分块处理后的图像进行第一级TinyYOLO网络检测;若依旧检测失败,则输出检测失败;若检测成功则进行步骤(3);(5)对第一级TinyYOLO网络检测输出的检测区域rk进行放大截取,然后输入至第二级TinyYOLO网络,第二级TinyYOLO网络最后一层输出所有预测目标区域信息R2:R2={ri|ri=(xi,yi,wi,hi,pi,c1i,c2i),i=1,2,...,50}与第一级TinyYOLO网络相同,采用非极大值抑制算法得到置信度最大的目标区域rj=(xj,yj,wj,hj,pj,c1j,c2j),结合放大区域的左上角坐标(xk_e,yk_e),得到最终的输出目标区域为r:r=(xk_e+xj,yk_e+yj,wj,hj)进一步的,所述步骤(1)中建立基于深度学习的第一级TinyYOLO目标检测模型和第二级TinyYOLO目标检测模型的具体步骤如下:(1.1)获取目标图像数据集,人工标注目标检测样本,按照VOC格式生成第一级TinyYOLO目标检测样本库;(1.2)设计第一级TinyYOLO目标检测网络,并通过训练得到第一级TinyYOLO目标检测模型;(1.3)根据第一级TinyYOLO目标检测模型与第一级TinyYOLO目标检测样本库自动生成第二级TinyYOLO目标检测样本库:例:第一级TinyYOLO目标检测样本:图片Ii,人工标注的目标区域ri=(xi,yi,wi,hi),第一级TinyYOLO目标检测模型M1:将Ii输入模型M1得到检测网络输出的目标区域r′i=(x′i,y′i,w′i,h′i),若区域r′i与ri的重叠率在0.5以上,则认为该图片可作为第二级TinyYOLO目标检测样本。以区域ri′的中心为中心进行放大与偏移的变换,分别放大3倍r′i_3、3.4倍r′i_3.4以及3.8倍r′i_3.8,然后进行上下左右的平移操作,生成若干个图像区域以及对应的目标区域,以放大3倍r′i_3无偏移为例展开如下说明:生成图片Ii(r′i_3)以及目标区域ri=(xi-x′i_3,yi-y′i_3,wi,hi),作为第二级TinyYOLO目标检测样本。(1.4)设计第二级TinyYOLO目标检测网络,并通过训练得到第二级TinyYOLO目标检测模型。进一步的,所述步骤(4)中对输入的图片I进行分块处理的具体步骤如下:(4.1)分别对全局图像I的宽高均匀分为11等份,生成11*11的网格;(4.2)假设目标处于图像的中部区域,忽略网格最外边缘的图像区域;(4.3)对内部9*9的网格图像区域进行四个子区域(I1~I4)的分割处理,如下所示,其中W、H分别为全局图像I的宽、高尺度进一步的,所述步骤(5)中对第一级TinyYOLO网络检测输出的检测区域rk进行放大截取的具体步骤如下:(5.1)以检测区域rk的中心为中心,对区域rk放大3.6倍,得到放大区域rk_expand:rk_expand=(xk_e,yk_e,wk_e,hk_e)wk_e=min{3.6·wk,W-xk_e}hk_e=min{3.6·hk,H-yk_e}(5.2)截取放大区域I(rk_expand),并记录放大区域的左上角坐标(xk_e,yk_e)以便恢复第二级TinyYOLO检测结果的区域信息。与现有技术相比,本专利技术的优点在于:(1)本专利技术具有可靠性:采用深度学习对大量的锥套目标检测样本进行训练,得到的检测模型相较于传统的图像检测识别模本文档来自技高网
...

【技术保护点】
1.一种基于深度学习的图像目标快速检测方法,其特征在于,包括如下步骤:(1)建立基于深度学习的第一级Tiny YOLO目标检测模型和第二级Tiny YOLO目标检测模型;(2)向第一级Tiny YOLO目标检测模型输入含有目标的测试图像,网络的最后一层输出所有预测目标区域信息R1:R1={ri|ri=(xi,yi,wi,hi,pi,c1i,c2i),i=1,2,...,845}其中ri为第i个预测目标区域,xi为第i个区域左上角点的横坐标,yi为第i个区域左上角点的纵坐标,wi为第i个区域的宽度,hi为第i个区域的高度,pi为第i个区域中含有目标的概率值或置信度,c1i为第i个区域中目标为第一类(近距目标)的概率值,c2i为第i个区域中目标为第二类(远距目标)的概率值,i的取值范围为1~845,由非极大值抑制算法得到置信度最大的目标区域rk:rk=(xk,yk,wk,hk,pk,c1k,c2k)pk=max{pi,i=1,2,...,845}根据目标区域rk的目标置信度pk及目标区域的宽高比判断检测是否成功,判断的条件如下:

【技术特征摘要】
1.一种基于深度学习的图像目标快速检测方法,其特征在于,包括如下步骤:(1)建立基于深度学习的第一级TinyYOLO目标检测模型和第二级TinyYOLO目标检测模型;(2)向第一级TinyYOLO目标检测模型输入含有目标的测试图像,网络的最后一层输出所有预测目标区域信息R1:R1={ri|ri=(xi,yi,wi,hi,pi,c1i,c2i),i=1,2,...,845}其中ri为第i个预测目标区域,xi为第i个区域左上角点的横坐标,yi为第i个区域左上角点的纵坐标,wi为第i个区域的宽度,hi为第i个区域的高度,pi为第i个区域中含有目标的概率值或置信度,c1i为第i个区域中目标为第一类(近距目标)的概率值,c2i为第i个区域中目标为第二类(远距目标)的概率值,i的取值范围为1~845,由非极大值抑制算法得到置信度最大的目标区域rk:rk=(xk,yk,wk,hk,pk,c1k,c2k)pk=max{pi,i=1,2,...,845}根据目标区域rk的目标置信度pk及目标区域的宽高比判断检测是否成功,判断的条件如下:若检测成功,进行步骤(3);若检测失败,进行步骤(4);(3)根据检测区域与图像分辨率的尺寸关系确定检测区域是否为小目标区域,若为小目标则进行步骤(5),判断为小目标的条件如下所示:W:图像宽度H:图像高度若不是小目标则输出目标区域r:r=(xk,yk,wk,hk)(4)对输入的图片进行分块处理,然后对分块处理后的图像进行第一级TinyYOLO网络检测;若依旧检测失败,则输出检测失败;若检测成功则进行步骤(3);(5)对第一级TinyYOLO网络检测输出的检测区域rk进行放大截取,然后输入至第二级TinyYOLO网络,第二级TinyYOLO网络最后一层输出所有预测目标区域信息R2:R2={ri|ri=(xi,yi,wi,hi,pi,c1i,c2i),i=1,2,...,50}与第一级TinyYOLO网络相同,采用非极大值抑制算法得到置信度最大的目标区域rj=(xj,yj,wj,hj,pj,c1...

【专利技术属性】
技术研发人员:李旺灵孙若陪孙永荣王国屹曾庆化赵伟
申请(专利权)人:南京航空航天大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1