基于深度学习的低功耗快速检测图像目标方法技术

技术编号:18445615 阅读:20 留言:0更新日期:2018-07-14 10:40
本发明专利技术公开了一种基于深度学习的低功耗快速检测图像目标方法,克服了现有技术中计算复杂度过高、神经网络模型占据较大磁盘空间的问题。本发明专利技术实现步骤为:(1)输入一幅300×300个像素的图像;(2)构建卷积神经网络;(3)第一次训练卷积神经网络;(4)第二次训练卷积神经网络;(5)计算卷积神经网络中与批量化层相邻卷积层权重系数和偏移值;(6)删除卷积神经网络中批量化层和比例缩放层;(7)输出目标检测坐标。由于本发明专利技术检测单张图像速度快、神经网络模型占据磁盘空间小,使得本发明专利技术具有可以部署在低功耗嵌入式设备上的优点。

Low power consumption fast detection of image targets based on deep learning

The invention discloses a low power fast detection image target method based on deep learning, and overcomes the problem that the computational complexity of the existing technology is too high and the neural network model occupies the larger disk space. The implementation steps are as follows: (1) input a 300 x 300 pixel image; (2) construct a convolution neural network; (3) the first training convolution neural network; (4) second training convolution neural network; (5) calculate the weight coefficient and offset of the convolution layer adjacent to the volume layer in the convolution neural network; (6) delete the convolution neural network batch. Quantization layer and scaling layer; (7) output target detection coordinates. The invention has the advantages that the invention can be deployed on low power embedded devices because of the rapid detection of single image and small disk space in the neural network model.

【技术实现步骤摘要】
基于深度学习的低功耗快速检测图像目标方法
本专利技术属于图像处理
,更进一步涉及目标检测
中的一种基于深度学习的低功耗快速检测图像目标方法。本专利技术基于卷积神经网络技术,利用低功耗嵌入式设备对任意尺寸的自然图像进行目标检测与识别。
技术介绍
基于深度学习技术的图像目标检测与识别方法具有识别精度高、易于训练等特点,不受图像尺寸和光照强度的影响。随着自然图像目标检测与识别技术逐渐成熟,被广泛应用于军事和民用的等领域。由于深度学习技术计算复杂度过高,不可避免的只能运行在大型服务器上,极大地影响了深度学习技术在低功耗嵌入式设备的应用。目前,基于自然图像目标检测与定位方法主要有两阶段神经网络目标检测方法(FasterR-CNN)。两阶段神经网络检测方法是最近提出的一种新的图像目标检测与定位方法,该方法基于卷积神经网络,通过卷积神经网络提取图像中特征来实现对图像中目标进行分类以及区域定位。ShaoRen,KaimingHe,RossGirshick,JianSun在其发表的论文“FasterR-CNN:TowardsReal-TimeObjectDetectionwithRegionProposalNetwork”(ComputerVisionandPatternRecognition,CVPR,January6,2016)中提出一种两阶段的基于自然图像的目标检测与定位方法。该方法首先通过区域建议网络(RegionProposalNetwork,RPN)生成建议图像区域,其中每张图像生成300个建议区域,把300个建议区域映射在最后一层神经网络中,通过建议区域池化层(ROIPooling)生成固定尺寸的特征图,利用分类概率(Softmax)将特征图进行分类,然后通过边框回归(BoundingBoxRegression)对目标进行定位。该方法可以实现对自然图像的定位,但是,该方法仍然存在的不足之处是,该方法计算复杂度过高,并且该方法使用的神经网络模型占用磁盘空间较大,导致FasterR-CNN算法不能部署在低功耗嵌入式设备上。博康智能网络科技股份有限公司拥有的专利技术“一种基于支持向量机的出租车识别方法”(专利申请号:201210356432.7,授权公告号:CN102902983B)中提出了一种基于支持向量机的目标检测方法。该专利技术采用面向梯度的直方图(Hog)特征提取算法对图像进行特征提取,将提取的特征通过支持向量机分类器(SVM),从而把图像分类为目标图像和非目标图像。该方法虽然能以较快速度识别出图像中的目标,但是,该方法仍然存在的不足之处是,该方法仅仅针对于图像的边缘特征、线性特征、中心环绕特征等特征,对于包含有噪音或者目标遮挡的图像,该方法检测效果较差。
技术实现思路
本专利技术的目的在于克服上述现有技术的不足,提出一种基于深度学习的低功耗快速检测图像目标方法。实现本专利技术目的的思路是,该方法首先对卷积神经网络模型使用模型压缩技术来减少计算量,然后利用单指令多数据汇编技术进一步加快卷积神经网络在低功耗嵌入式设备上的运算速度。该方法不仅有效减少运行时间,同时很好的保持了目标检测与识别精度。为实现上述目的,本专利技术的具体步骤如下:(1)输入一幅300×300个像素的图像;(2)构建卷积神经网络:构建一个含有主干神经网络、分类以及回归神经网络、输出网络三部分共189层的卷积神经网络;(3)第一次训练卷积神经网络:(3a)将300×300个像素的图像输入到卷积神经网络,计算卷积神经网络输出值与真实值之间的误差值;(3b)利用反向传播算法训练卷积神经网络;(3c)判断卷积神经网络输出值与真实值之间的误差值是否大于0.9,若是,则执行步骤(3a),否则,得到第一次训练好的卷积神经网络,执行步骤(4);(4)第二次训练卷积神经网络:(4a)将300×300个像素的图像调整为尺寸为224×224像素的图像;(4b)将尺寸为224×224像素的图像输入到卷积神经网络,计算卷积神经网络输出值与真实值之间的误差值;(4c)利用反向传播算法训练卷积神经网络;(4d)判断卷积神经网络输出值与真实值之间的误差值是否大于0.9,若是,则执行步骤(4b),否则,得到第二次训练好的卷积神经网络,执行步骤(5);(5)计算卷积神经网络中与批量化层相邻卷积层权重系数和偏移值:(5a)计算卷积神经网络中与批量化层相邻卷积层的权重系数;(5b)计算卷积神经网络中与批量化层相邻卷积层的偏移值;(6)删除卷积神经网络中批量化层和比例缩放层;(7)输出目标检测坐标:将尺寸为224×224像素的图像输入到卷积神经网络中,将网络输出层中每个神经元的输出值组成一组特征向量,特征向量表示卷积神经网络检测到的目标在该图像中的坐标值。本专利技术与现有的技术相比具有以下优点:第一,由于本专利技术构建了包含主干神经网络、分类以及回归神经网络、输出网络三部分的189层卷积神经,通过卷积神经网络中的自学习特性,可以学习到图像的边缘特征、线性特征、中心环绕特征、纹理特征、空间关系特征和角点特征,克服了现有技术中仅仅提取图像的边缘特征、线性特征、中心环绕特征,而无法抑制图像中噪音的问题,使得本专利技术具有抑制图像中噪声的优点。第二,由于本专利技术删除了卷积神经网络中的比例缩放层,减少了卷积神经网络模型占据的磁盘空间,克服了现有技术中神经网络模型,占用较大磁盘空间不足,使得本专利技术具有可以部署在低功耗嵌入式设备上的优点。第三,由于本专利技术删除了卷积神经网络中的批量化层,去除了卷积神经网络中对批量化层的计算,克服了现有技术中计算复杂度过高的不足,使得本专利技术具有运行速度快的优点。附图说明图1为本专利技术的流程图;图2为本专利技术在仿真实验中待检测的单目标测试图像;图3为本专利技术在仿真实验中待检测的多目标测试图像;图4为本专利技术在仿真实验获得的单目标检测图像;图5为本专利技术在仿真实验获得的多目标检测图像。具体实施方式下面结合附图对本专利技术做进一步的描述。参照附图1,本专利技术的具体步骤如下:步骤1,输入一幅300×300个像素的图像。步骤2,构建卷积神经网络。构建一个含有主干神经网络、分类以及回归神经网络、输出网络三部分共189层的卷积神经网络。步骤3,第一次训练卷积神经网络。将300×300个像素的图像输入到卷积神经网络,计算卷积神经网络输出值与真实值之间的误差值。按照下式,计算卷积神经网络输出值与真实值之间误差值:其中,L(x,c)表示卷积神经网络预测值与真实值之间的误差值,M表示训练过程中前景回归框的数量,N表示训练过程中回归框的总数量,xi表示卷积神经网络预测的第i个回归框与真实回归框的偏差,cj表示卷积神经网络对第j个回归框中所包含物体的预测概率。利用反向传播算法训练卷积神经网络。重复执行上述步骤,直到卷积神经网络输出值与真实值之间误差值小于等于0.9,得到训练好的卷积神经网络。步骤4,第二次训练卷积神经网络。将300×300个像素的图像调整为尺寸为224×224像素的图像。将尺寸为224×224像素的图像输入到卷积神经网络,计算卷积神经网络输出值与真实值之间的误差值。按照下式,计算卷积神经网络输出值与真实值之间误差值:利用反向传播算法训练卷积神经网络。重复执行上述步骤,直到卷积神经网络输出值与真实值之本文档来自技高网
...

【技术保护点】
1.一种基于深度学习的低功耗快速检测图像目标方法,其特征在于,包括如下步骤:(1)输入一幅300×300个像素的图像;(2)构建卷积神经网络:构建一个含有主干神经网络、分类以及回归神经网络、输出网络三部分共189层的卷积神经网络;(3)第一次训练卷积神经网络:(3a)将300×300个像素的图像输入到卷积神经网络,计算卷积神经网络输出值与真实值之间的误差值;(3b)利用反向传播算法训练卷积神经网络;(3c)判断卷积神经网络输出值与真实值之间的误差值是否大于0.9,若是,则执行步骤(3a),否则,得到第一次训练好的卷积神经网络,执行步骤(4);(4)第二次训练卷积神经网络:(4a)将300×300个像素的图像调整为尺寸为224×224像素的图像;(4b)将尺寸为224×224像素的图像输入到卷积神经网络,计算卷积神经网络输出值与真实值之间的误差值;(4c)利用反向传播算法训练卷积神经网络;(4d)判断卷积神经网络输出值与真实值之间的误差值是否大于0.9,若是,则执行步骤(4b),否则,得到第二次训练好的卷积神经网络,执行步骤(5);(5)计算卷积神经网络中与批量化层相邻卷积层权重系数和偏移值:(5a)计算卷积神经网络中与批量化层相邻卷积层的权重系数;(5b)计算卷积神经网络中与批量化层相邻卷积层的偏移值;(6)删除卷积神经网络中批量化层和比例缩放层;(7)输出目标检测坐标:将尺寸为224×224像素的图像输入到卷积神经网络中,将网络输出层中每个神经元的输出值组成一组特征向量,特征向量表示卷积神经网络检测到的目标在该图像中的坐标值。...

【技术特征摘要】
1.一种基于深度学习的低功耗快速检测图像目标方法,其特征在于,包括如下步骤:(1)输入一幅300×300个像素的图像;(2)构建卷积神经网络:构建一个含有主干神经网络、分类以及回归神经网络、输出网络三部分共189层的卷积神经网络;(3)第一次训练卷积神经网络:(3a)将300×300个像素的图像输入到卷积神经网络,计算卷积神经网络输出值与真实值之间的误差值;(3b)利用反向传播算法训练卷积神经网络;(3c)判断卷积神经网络输出值与真实值之间的误差值是否大于0.9,若是,则执行步骤(3a),否则,得到第一次训练好的卷积神经网络,执行步骤(4);(4)第二次训练卷积神经网络:(4a)将300×300个像素的图像调整为尺寸为224×224像素的图像;(4b)将尺寸为224×224像素的图像输入到卷积神经网络,计算卷积神经网络输出值与真实值之间的误差值;(4c)利用反向传播算法训练卷积神经网络;(4d)判断卷积神经网络输出值与真实值之间的误差值是否大于0.9,若是,则执行步骤(4b),否则,得到第二次训练好的卷积神经网络,执行步骤(5);(5)计算卷积神经网络中与批量化层相邻卷积层权重系数和偏移值:(5a)计算卷积神经网络中与批量化层相邻卷积层的权重系数;(5b)计算卷积神经网络中与批量化层相邻卷积层的偏移值;(6)删除卷积神经网络中批量化层和比例缩放层;(7)输出目标检测坐标:将尺寸为224×224像素的图像输入到卷积神经网络中,将网络输出层中每个神经元的输出值组成一组特征向量,特征向量表示卷积神经网络检测到的目标在该图像中的坐标值。2...

【专利技术属性】
技术研发人员:宋彬吴广伟郭洁梁大卫
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:陕西,61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1