基于深度神经网络的目标检测方法及装置制造方法及图纸

技术编号:20004789 阅读:23 留言:0更新日期:2019-01-05 17:35
本发明专利技术提供一种基于深度神经网络的目标检测方法及装置,所述方法包括:获取待检测图像;将所述待检测图像输入至训练好的深度神经网络模型,输出所述待检测图像中的目标物体的边界框,其中,所述深度神经网络模型包含一个多层级联的回归网络。本发明专利技术提供的基于深度神经网络的目标检测方法及装置,通过对现有的SSD网络改进,在网络结构中设置一个多层级联的回归网络,提高了目标检测的检测速度,并提高了目标检测的检测精度。

Target Detection Method and Device Based on Deep Neural Network

The invention provides a target detection method and device based on depth neural network, which includes acquiring the image to be detected, inputting the image to be detected into the trained depth neural network model, and outputting the boundary frame of the target object in the image to be detected, in which the depth neural network model includes a multi-layer cascaded regression network. The target detection method and device based on the depth neural network provided by the invention improves the existing SSD network and sets up a multi-layer cascade regression network in the network structure, which improves the detection speed of target detection and improves the detection accuracy of target detection.

【技术实现步骤摘要】
基于深度神经网络的目标检测方法及装置
本专利技术涉及计算机
,尤其涉及一种基于深度神经网络的目标检测方法及装置。
技术介绍
目标检测,也叫目标提取,是一种基于目标几何和统计特征的图像分割,它将目标的分割和识别合二为一,其准确性和实时性是整个系统的一项重要能力。尤其是在复杂场景中,需要对多个目标进行实时处理时,目标自动提取和识别就显得特别重要。现有技术中,基于深度学习的目标检测方法包括基于RegionProposal的深度学习目标检测算法的两步检测法,以及以SingleShotMultiBoxDetector(SSD)为主的单步检测法。其中两步检测法的第一步为选取候选边界框的过程,也就是在图片中选取可能包含物体的边界框。第二步为对所选择的候选边界框进行分类和边界框位置的调整。这种方法精度比较高,但是速度比较慢,使用GPU也只能达到每秒几张的速度。基于SSD的单步检测方法则是直接设置一些默认的候选边界框然后直接对这些边界框进行分类和边界框位置调整。这种方法精度比两步检测法稍低一点,但是速度非常快,使用GPU每秒可以处理几十张,显然对于快速目标检测这种方法比较合适,但是这类方法对于目标位置的精确性常常不能达到要求。
技术实现思路
本专利技术的目的是提供一种基于深度神经网络的目标检测方法及装置,解决了现有技术中目标检测方法检测速度慢、以及检测精度低的技术问题。为了解决上述技术问题,一方面,本专利技术提供一种基于深度神经网络的目标检测方法,包括:获取待检测图像;将所述待检测图像输入至训练好的深度神经网络模型,输出所述待检测图像中的目标物体的边界框,其中,所述深度神经网络模型包含一个多层级联的回归网络。另一方面,本专利技术提供一种基于深度神经网络的目标检测装置,包括:获取模块,用于获取待检测图像;检测模块,用于将所述待检测图像输入至训练好的深度神经网络模型,输出所述待检测图像中的目标物体的边界框,其中,所述深度神经网络模型包含一个多层级联的回归网络。再一方面,本专利技术提供一种用于基于深度神经网络的目标检测的电子设备,包括:存储器和处理器,所述处理器和所述存储器通过总线完成相互间的通信;所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行上述的方法。又一方面,本专利技术提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法。本专利技术提供的基于深度神经网络的目标检测方法及装置,通过对现有的SSD网络改进,在网络结构中设置一个多层级联的回归网络,提高了目标检测的检测速度,并提高了目标检测的检测精度。附图说明图1为依照本专利技术实施例的基于深度神经网络的目标检测方法示意图;图2为依照本专利技术实施例的深度神经网络模型的结构示意图;图3为依照本专利技术实施例的多层级联的回归网络的结构示意图;图4为依照本专利技术实施例的基于深度神经网络的目标检测装置示意图;图5为本专利技术实施例提供的用于基于深度神经网络的目标检测的电子设备的结构示意图。具体实施方式为了使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。图1为依照本专利技术实施例的基于深度神经网络的目标检测方法示意图,如图1所示,本专利技术实施例提供一种基于深度神经网络的目标检测方法,该方法包括:步骤S101、获取待检测图像;步骤S102、将所述待检测图像输入至训练好的深度神经网络模型,输出所述待检测图像中的目标物体的边界框,其中,所述深度神经网络模型包含一个多层级联的回归网络。具体的,首先,需要获取待检测图像,待检测图像通常由照相机或者摄像机采集,待检测图像中包含目标物体,目标物体包括行人,轿车,自行车,摩托车,卡车,公交车、动物等生活中常见的静止的或者运动的物体。优选的,为了获取更高的检测精度,还可以对获取到的待检测图像进行预处理,预处理步骤包括一些基本的减均值操作等。然后,将待检测图像输入至训练好的深度神经网络模型,输出待检测图像中的目标物体的边界框,其中,深度神经网络模型包含一个多层级联的回归网络。图2为依照本专利技术实施例的深度神经网络模型的结构示意图,如图2所示,该训练好的深度神经网络模型包括输入端,多层级联的回归网络和输出端。待检测图像从输入端输入深度神经网络模型,经过深度神经网络模型的池化层进行降维处理后,获得多个不同尺度的特征图,多层级联的回归网络对输入的每一特征图进行多次分类和回归,输出端输出待检测图像中的目标物体的边界框,完成对目标的检测,提高了检测精度。回归就是指对目标物体边界框大小和位置的预测。本专利技术实施例提供的基于深度神经网络的目标检测方法,通过对现有的SSD网络改进,在网络结构中设置一个多层级联的回归网络,提高了目标检测的检测速度,并提高了目标检测的检测精度。在上述实施例的基础上,进一步地,所述回归网络包含多层回归结构,上一层回归结构的输出为下一层回归结构的输入。具体的,图3为依照本专利技术实施例的多层级联的回归网络的结构示意图,如图3所示,回归网络包含多层回归结构,上一层回归结构的输出为下一层回归结构的输入,每一层回归结构均对特征图进行一次分类和回归。图3中,多层级联的回归网络包含第一层回归结构、第二层回归结构和第三层回归结构,第一层回归结构的输出为第二层回归结构的输入,第二层回归结构的输出为第三层回归结构的输入,第一层回归结构、第二层回归结构和第三层回归结构各分别对特征图进行了一次分类和回归。需要说明的是,图3示例性地给出了一个包含三层回归结构的多层级联的回归网络,而在实际应用中不限于此,回归网络中回归结构的层数可以视情况而定。本专利技术实施例提供的基于深度神经网络的目标检测方法,通过对现有的SSD网络改进,在网络结构中设置一个多层级联的回归网络,提高了目标检测的检测速度,并提高了目标检测的检测精度。在以上各实施例的基础上,进一步地,所述回归网络包含多层回归结构,上一层回归结构的输出为下一层回归结构的输入;所述回归网络中上一层回归结构的IOU值小于下一层回归结构的IOU值。具体的,在构建深度神经网络模型时,回归网络中上一层回归结构的IOU值小于下一层回归结构的IOU值。例如,上一层回归结构的IOU值为0.7,下一层回归结构的IOU值可以设置成0.9。IOU(IntersectionoverUnion)用于测量真实和预测之间的相关度,相关度越高,该值越高。IOU值表示目标物体的真实边界框与预测边界框,两个边界框的交集与并集的比值,交集指两者的重叠区域的面积,并集指两者重叠后所占区域面积。通过设置上一层回归结构的IOU值小于下一层回归结构的IOU值,使经过多层级联的回归网络对输入的每一特征图进行多次分类和回归,且每次进行分类和回归输出的结果的精确度,逐层递增,最终输出精确的检测结果。本专利技术实施例提供的基于深度神经网络的目标检测方法,通过对现有的SSD网络改进,在网络结构中设置一个多层级联的回归网络,提高了目标检测的检测速度,并提高了目标检测的检测精度。在以上各实施例的基础上,进一步地本文档来自技高网...

【技术保护点】
1.一种基于深度神经网络的目标检测方法,其特征在于,包括:获取待检测图像;将所述待检测图像输入至训练好的深度神经网络模型,输出所述待检测图像中的目标物体的边界框,其中,所述深度神经网络模型包含一个多层级联的回归网络。

【技术特征摘要】
1.一种基于深度神经网络的目标检测方法,其特征在于,包括:获取待检测图像;将所述待检测图像输入至训练好的深度神经网络模型,输出所述待检测图像中的目标物体的边界框,其中,所述深度神经网络模型包含一个多层级联的回归网络。2.根据权利要求1所述的方法,其特征在于,所述回归网络包含多层回归结构,上一层回归结构的输出为下一层回归结构的输入。3.根据权利要求1所述的方法,其特征在于,所述回归网络包含多层回归结构,上一层回归结构的输出为下一层回归结构的输入;所述回归网络中上一层回归结构的IOU值小于下一层回归结构的IOU值。4.根据权利要求1所述的方法,其特征在于,所述回归网络包含多层回归结构,上一层回归结构的输出为下一层回归结构的输入;所述回归网络中上一层回归结构的IOU值小于下一层回归结构的IOU值;所述回归网络中每一层回归结构的IOU值是可手动设置的。5.根据权利要求1所述的方法,其特征在于,所述回归网络包含三层回归结构,上一层回归结构的输出为下一层回归结构的输入;所述回归网络中上一层回归结构的IOU值小于下一层回归结构的IOU值;所述回归网络中每一层回归结构的IOU值是可手动设置的。6.根据权利要求1所述的方法,其特征在于,所述回归网络包含三层回归结构,...

【专利技术属性】
技术研发人员:姚勇强董远白洪亮熊风烨
申请(专利权)人:北京飞搜科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1