一种SSD目标检测卷积神经网络的加速计算方法技术

技术编号:23025426 阅读:18 留言:0更新日期:2020-01-03 17:03
本发明专利技术公开了一种SSD目标检测卷积神经网络的加速计算方法,包括以下步骤:S1、将SSD目标检测卷积神经网络训练阶段的目标框Box回归层和目标分类回归层删除,使用一个新的卷积层同时进行Box推导计算和目标分类计算;S2、在新的卷积层后添加一个BlobSplit层,通过BlobSplit层将新的卷积层输出的Blob按照配置的channel拆分成两个独立的Blob并输出给训练阶段后续的两个相关层;S3、将SSD目标检测卷积神经网络推导阶段的目标框Box回归层和目标分类回归层删除,使用一个新的卷积层同时进行Box推导计算和目标分类计算;S4、将SSD目标检测卷积神经网络推导阶段的后续相关层全部删除,在新的卷积层后连接一个Object_Detector层。

An accelerated calculation method of convolution neural network for SSD target detection

【技术实现步骤摘要】
一种SSD目标检测卷积神经网络的加速计算方法
本专利技术涉及计算机视觉领域,尤其涉及一种SSD目标检测卷积神经网络的加速计算方法,
技术介绍
近年来深度神经网络在计算机视觉领域兴起,除了人工设计的传统特征,使用深度神经网络可以提取到高层次的多种特征,例如Krizhevsky于2012年在论文“ImageNetClassificationwithDeepConvolutionalNeuralNetworks”中提出的深度神经网络已经能够提取图片的丰富的多层次特征,作者用该网络提取的丰富特征对图片进行分类,并在ILSVRC-2012比赛中摘得了桂冠。此外,目标检测领域取得的丰富成果,让我们可以得到图片中特定物体的大致定位框,并能够识别物体的类别属性。WeiLiu于2016年在论文“SSD:SingleShotMultiBoxDetector”提出的SSD算法通过对图片中物体回归定位的方法进行预测图片中物体的定位框,并且在VOC2007的测试集上达到了74.3%的平均准确率。SSD在诞生至今,一直是主流的通用目标检测算法,也在其基础之上定制优化产生出大批优质的专用目标检测算法。SSD一直是卷积神经网络目标检测算法在工程应用领域最主流的目标检测算法之一。相比于其他的目标检测算法,如Faster-RCNN,yolov1至yolov3,SSD都有其非常明显的优点。相比Faster-RCNN,SSD的速度更快,前者以检测精度著称,SSD在做到接近前者精度的基础上,速度是其近10倍;相比Yolo系列,SSD可以做到与之速度相近,但在目标检测精度上却与之有明显的优势,Yolo系列目标检测算法是目前所有目标检测算法中,在基本方法上最快的检测算法。SSD的官方版本的代码是基于caffe框架实现,caffe是目标在工程应用领域非常成熟和应用广泛的深度学习框架,代码完全开源,全球有大批的开发者维护代码,代码成熟。上面提到的Yolo系列目标检测算法(目前已经发展到第三个优化改进版本Yolov3),是和SSD类似的通用目标检测算法,是目前目标检测算法中最快的一种(前提是保证深度学习框架,特征提取网络都完全一致)。在目标检出率,map等评测指标下,其精度已经接近甚至超过了SSD。但是在实际对比测试中,在保证相同的数据集,同样的深度学习框架,同样的特征提取基础网络下,Yolo3的目标检测精度(检测目标框的准确度)还是明显不如SSD。但是却发现,在特定的相同的网络结构下,Yolov3居然比SSD快近1倍,差距非常之大。但是SSD和Yolov3均是全卷积网络,其基本思想稍有差别但基本相似,绝不会造成速度上如此之大差距。而SSD的目标框预测的准确性又明显高于Yolov3,在实际项目中更加倾向于更加准确的SSD。因此,迫切需要一种方法,能够保证不影响检测精度的基础上,让SSD的检测速度能够接近甚至和Yolov3持平。这样SSD在速度和精度的综合实力将得到大大的提高,将可以更好的适用于工程应用之中。
技术实现思路
本专利技术目的是针对上述问题,提供一种明显提高计算速度的SSD目标检测卷积神经网络的加速计算方法。为了实现上述目的,本专利技术的技术方案是:一种SSD目标检测卷积神经网络的加速计算方法,包括以下步骤:S1、将SSD目标检测卷积神经网络训练阶段的目标框Box回归层和目标分类回归层删除,使用一个新的卷积层同时进行Box推导计算和目标分类计算;S2、在新的卷积层后添加一个BlobSplit层,通过BlobSplit层将新的卷积层输出的Blob按照配置的channel拆分成两个独立的Blob并输出给训练阶段后续的两个相关层;S3、将SSD目标检测卷积神经网络推导阶段的目标框Box回归层和目标分类回归层删除,使用一个新的卷积层同时进行Box推导计算和目标分类计算;S4、将SSD目标检测卷积神经网络推导阶段的后续相关层全部删除,在新的卷积层后连接一个直接提取目标Box框和分类信息的Object_Detector层。进一步的,所述SSD目标检测卷积神经网络是基于caffe深度学习框架下的SSD目标检测网络。与现有技术相比,本专利技术具有的优点和积极效果是:本专利技术利用BlobSplit层对新的卷积层输出的Blob进行拆分的方法,实现了一个卷积层做到Box回归和分类计算两个计算任务,同时充分利用原始网络的后续层成熟复杂的loss计算和反向导数传播代码,减少训练阶段的开发量;并且本专利技术利用Object_Detector层直接计算Box和分类结果,省略了维度变换和内存重排的操作,其实现了一套完整的SSD算法的改进和优化,在不降低任何检测精度的前提下,达到了提高SSD目标检测网络计算速度的目的,从而使得SSD目标检测算法在工程应用领域的可用性和性价比更高。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为yolov3推导阶段的网络结构图;图2为原始的SSD推导阶段的网络结构图;图3为改进后的SSD训练阶段的网络结构图;图4为原始的SSD训练阶段的网络结构图;图5为改进后的SSD推导阶段的网络结构图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,所作的任何修改、等同替换、改进等,均应包含在本专利技术的保护范围之内。如图1至图5所示,在很多特征提取基础网络结构上,SSD的检测速度总比Yolov3慢,有的慢的不是特别多,但在部分特征提取基础网络下,Yolov3比SSD快一倍(Yolov3-6ms/帧,SSD-12ms/帧)。两者均是全卷积网络,SSD中并没有全连接这种参数量巨大,计算量巨大的计算任务,基本方法两者几乎相同。在同样的基础网络和深度学习框架下,两者的速度应该几乎相同。在研究中,为了让SSD的检测速度接近YoloV3,强制的将卷积层的卷积核减半,保守估计计算速度会提升一倍。但是发现,SSD的计算速度提升不到10%。显然减少网络参数,计算量虽让在理论上减少50%以上,但是并不能给计算速度带来明显提升。且此时SSD的基础网络已经比YoloV3更加的轻量化,已经背离了其他可变参数一致的原则。在以上试验后,将优化的目标放在网络的结构上,如图1(Yolov3推导过程的网络基本结构),图2(SSD推导过程的网络基本结构)所示。在实验中发现,基础网络部分使用约5ms的时间,Yolov3的剩余的层,在1ms内就完成了剩余的计算工作,但是SSD的网络结构却用了约7ms的时间,本文档来自技高网
...

【技术保护点】
1.一种SSD目标检测卷积神经网络的加速计算方法,其特征在于:包括以下步骤:/nS1、将SSD目标检测卷积神经网络训练阶段的目标框Box回归层和目标分类回归层删除,使用一个新的卷积层同时进行Box推导计算和目标分类计算;/nS2、在新的卷积层后添加一个BlobSplit层,通过BlobSplit层将新的卷积层输出的Blob按照配置的channel拆分成两个独立的Blob并输出给训练阶段后续的两个相关层;/nS3、将SSD目标检测卷积神经网络推导阶段的目标框Box回归层和目标分类回归层删除,使用一个新的卷积层同时进行Box推导计算和目标分类计算;/nS4、将SSD目标检测卷积神经网络推导阶段的后续相关层全部删除,在新的卷积层后连接一个直接提取目标Box框和分类信息的Object_Detector层。/n

【技术特征摘要】
1.一种SSD目标检测卷积神经网络的加速计算方法,其特征在于:包括以下步骤:
S1、将SSD目标检测卷积神经网络训练阶段的目标框Box回归层和目标分类回归层删除,使用一个新的卷积层同时进行Box推导计算和目标分类计算;
S2、在新的卷积层后添加一个BlobSplit层,通过BlobSplit层将新的卷积层输出的Blob按照配置的channel拆分成两个独立的Blob并输出给训练阶段后续的两个相关层;
S3、将SSD目标检测卷积神经...

【专利技术属性】
技术研发人员:韩梦江楼燚航白燕张永祥陈杰
申请(专利权)人:博云视觉北京科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1