基于目标检测网络的多标签物体检测方法、系统、装置制造方法及图纸

技术编号:21300910 阅读:30 留言:0更新日期:2019-06-12 08:16
本发明专利技术属于计算机视觉领域,具体涉及了一种基于目标检测网络的多标签物体检测方法、系统、装置,旨在解决现有目标检测技术精度较低,不能很好地解决多标签物体实时准确地检测的问题。本发明专利技术方法包括:获取待检测物体的图像作为输入图像;采用训练后的目标检测网络,依据输入图像获取待检测物体的类别以及待检测物体中心坐标、检测矩形框长度和宽度;输出待检测物体的类别以及待检测物体中心坐标、检测矩形框长度和宽度。本发明专利技术方法实现了对不同类别目标的实时、精确检测,提高了检测的速度和精度,并且可以对目标检测中相互重叠、存在遮挡的情况进行很好的处理。

Multi-label Object Detection Method, System and Device Based on Target Detection Network

The invention belongs to the field of computer vision, and specifically relates to a multi-label object detection method, system and device based on the target detection network, aiming at solving the problem that the existing target detection technology has low accuracy and can not solve the problem of real-time and accurate detection of multi-label objects. The method of the invention includes: acquiring the image of the object to be detected as the input image; using the trained target detection network, acquiring the category of the object to be detected and the central coordinates of the object to be detected, the length and width of the rectangular box to be detected; outputting the category of the object to be detected, the central coordinates of the object to be detected, and the length and width of the rectangular box to be detected. The method realizes real-time and accurate detection of different kinds of targets, improves the speed and accuracy of detection, and can deal with overlapping and occlusion situations in target detection.

【技术实现步骤摘要】
基于目标检测网络的多标签物体检测方法、系统、装置
本专利技术属于计算机视觉领域,具体涉及了一种基于目标检测网络的多标签物体检测方法、系统、装置。
技术介绍
随着人工智能、机器学习技术的迅速发展和日趋成熟,自主目标检测技术成为了近年来国内外深度学习研究的热点问题,在智能交通、医学图像处理、机器人技术、农业物联网方面拥有着广泛的应用前景。现实生活中,物体种类繁多、个体分布方式复杂,人类可以通过感知物体形状、颜色、纹理和距离等信息,准确判断物体的类别和位置,但这对于计算机视觉来说是极大的挑战。因此,使计算机拥有与人类相似甚至超过人类的目标检测能力,已经成为当前目标检测技术的重要方向和主要挑战。目标检测的主要研究方法是提取目标颜色、形状、纹理等特征实现目标描述,然后利用一定的机器学习算法进行目标类型和目标位置、轮廓的学习,最后对目标进行分类、定位及画框,实现目标检测。但是待检测的目标存在类内差异大、类间相似度高的情况,这种情况下提取的特征通常很难反映出类间差异和类内共性。尤其在物体具有多个标签的情况下,由于传统特征提取方式的限制,不同标签所使用的特征之间往往是没有关联的,这使物体识别起来更加困难。在实际目标检测的过程中,目标物之间的相互重叠、存在遮挡等情况使得目标类间分类边界不明显,类内区分困难,这也对目标的实际检测带来很大的挑战。多标签物体检测问题目前主要依靠两种类型的方法来处理。一种是基于传统图像处理的方法,首先对物体图像提取一些Haar、SIFT、HOG、SURF、DPM等特征,然后采用传统的分类器获取物体类别的预测结果及位置信息,该方法的识别速度比较快,但是识别准确率比较低,并且特征一般由人工提取,工作量大、不具备普适性;另一种是使用深度学习方法进行目标检测。目前的深度学习的目标检测方法主要分为两类:一类是以R-CNN为代表的基于候选区域的目标检测网络,在精度和速度上有了很大的提升,但在高分辨率图像检测问题上难以实现实时检测;一类是以YOLO为代表的将目标检测问题转换为回归问题的目标检测网络,检测速度快,但算法检测精度略低。总的来说,虽然该领域提出了很多目标检测网络,但无法兼顾检测速度与精度的要求,不能取得理想的结果。
技术实现思路
为了解决现有技术中的上述问题,即现有目标检测技术不能兼顾检测速度和高精度要求的问题,本专利技术提供了一种基于目标检测网络的多标签物体检测方法,包括:步骤S10,获取待检测物体的图像作为输入图像;步骤S20,基于训练后的目标检测网络,依据所述输入图像,获取待检测物体的类别以及待检测物体中心坐标、检测矩形框长度和宽度;步骤S30,输出待检测物体的类别以及待检测物体中心坐标、检测矩形框长度和宽度;其中,所述的目标检测网络,为采用密集连接卷积网络替代YOLO-V3网络中分辨率低的特征层所得到的网络。在一些优选的实施例中,所述目标检测网络的训练步骤为:步骤B10,将获取的训练图像集中每一个图像根据标准格式调整图像属性,获得标准化训练图像集;步骤B20,采用所述目标检测网络检测标准化训练图像集中一个批次的图像,并计算所述目标检测网络各分类器的训练误差值;步骤B30,当未达到预设的训练次数或者所述训练误差值不低于预设的阈值时,采用误差反向传播的方法,获得各层参数的变化量并更新所述目标检测网络的参数;步骤B40,采用所述更新后的目标检测网络按批次顺序检测标准化训练图像集,并采用步骤B30的方法迭代更新所述目标检测网络的参数,直至达到预设的训练次数或者所述训练损失值低于预设的阈值,获得训练好的目标检测网络。在一些优选的实施例中,所述训练误差,其计算方法为:Loss=Errorcoord+Erroriou+Errorcls其中,Loss为训练误差,Errorcoord为坐标预测误差,Erroriou为预测边界框和真实边界框的重合度误差,Errorcls为分类误差。在一些优选的实施例中,所述坐标预测误差,其计算方法为:其中,λcorrd为坐标误差的权重,S2为输入图像分割的格子数量,B为每个格子生成的边界框数量,代表物体落入第i个格子的第j个边界框内,分别为边界框的中心坐标的预测值,分别为边界框的长度和宽度的预测值,xi、yi分别为边界框的中心坐标的真实值,wi、hi分别为边界框的长度和宽度的真实值。在一些优选的实施例中,所述预测边界框和真实边界框的重合度误差,其计算方法为:其中,λnoobj为预测边界框和真实边界框的重合度误差的权重,S2为输入图像分割的格子数量,B为每个格子生成的边界框数量,代表物体落入第i个格子的第j个边界框内,Ci为置信度的真实值。在一些优选的实施例中,所述分类误差,其计算方法为:其中,S2为输入图像分割的格子数量,B为每个格子生成的边界框数量,代表物体落入第i个格子的第j个边界框内,代表第i个格子中的物体是类别c的概率的预测值,pi(c)代表第i个格子中的物体是类别c的概率的真实值。在一些优选的实施例中,步骤B10中“将获取的训练图像集中每一个图像根据标准格式调整图像属性”之前,还包括对训练图像集的增强处理步骤:采用颜色均衡、亮度变换、角度变换、模糊处理中的一种或多种方法对所述训练图像集中的图像进行数据增强,获得增强后的训练图像集。本专利技术的另一方面,提出了一种基于目标检测网络的多标签物体检测系统,包括输入模块、目标检测模块、图像增强模块、图像格式标准化模块、输出模块;所述输入模块,配置为获取待检测物体图像并输入;所述目标检测模块,配置为处理待检测物体图像,获得待检测物体的类别以及待检测物体中心坐标、检测矩形框长度和宽度;图像增强模块,配置为采用颜色均衡、亮度变换、角度变换、模糊处理中的一种或多种方法对训练图像集进行数据增强;所述图像格式标准化模块,配置为根据标准格式调整训练图像集的图像属性;所述输出模块,配置为输出待检测物体的类别以及待检测物体中心坐标、检测矩形框长度和宽度。本专利技术的第三方面,提出了一种存储装置,其中存储有多条程序,所述程序适于由处理器加载并执行以实现上述的基于目标检测网络的多标签物体检测方法。本专利技术的第四方面,提出了一种处理装置,包括处理器、存储装置;所述处理器,适于执行各条程序;所述存储装置,适于存储多条程序;所述程序适于由处理器加载并执行以实现上述的基于目标检测网络的多标签物体检测方法。本专利技术的有益效果:(1)本专利技术方法针对图像中不同类别目标实时检测问题,使用DenseNet方法改进了YOLO-V3网络,实现了对不同类别目标的实时、精确检测。(2)本专利技术方法相比于FasterR-CNN等方法,在目标检测问题上速度更快、精度更高,可以对目标检测中相互重叠、存在遮挡的情况进行很好的处理。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:图1是本专利技术基于目标检测网络的多标签物体检测方法的流程示意图;图2是本专利技术基于目标检测网络的多标签物体检测方法的一种实施例的训练图像集优化流程示意图;图3是本专利技术基于目标检测网络的多标签物体检测方法的一种实施例的目标检测网络训练的流程示意图;图4是本专利技术基于目标检测网络的多标签物体检测方法的一种实施例的目标检测网络结构示意图;图5是本专利技术基于目标检测网络的多本文档来自技高网
...

【技术保护点】
1.一种基于目标检测网络的多标签物体检测方法,其特征在于,包括:步骤S10,获取待检测物体的图像作为输入图像;步骤S20,基于训练后的目标检测网络,依据所述输入图像,获取待检测物体的类别以及待检测物体中心坐标、检测矩形框长度和宽度;步骤S30,输出待检测物体的类别以及待检测物体中心坐标、检测矩形框长度和宽度;其中,所述的目标检测网络,为采用密集连接卷积网络替代YOLO‑V3网络中分辨率低的特征层所得到的网络。

【技术特征摘要】
1.一种基于目标检测网络的多标签物体检测方法,其特征在于,包括:步骤S10,获取待检测物体的图像作为输入图像;步骤S20,基于训练后的目标检测网络,依据所述输入图像,获取待检测物体的类别以及待检测物体中心坐标、检测矩形框长度和宽度;步骤S30,输出待检测物体的类别以及待检测物体中心坐标、检测矩形框长度和宽度;其中,所述的目标检测网络,为采用密集连接卷积网络替代YOLO-V3网络中分辨率低的特征层所得到的网络。2.根据权利要求1所述的基于目标检测网络的多标签物体检测方法,其特征在于,所述目标检测网络的训练步骤为:步骤B10,将获取的训练图像集中每一个图像根据标准格式调整图像属性,获得标准化训练图像集;步骤B20,采用所述目标检测网络检测标准化训练图像集中一个批次的图像,并计算所述目标检测网络各分类器的训练误差值;步骤B30,当未达到预设的训练次数或者所述训练误差值不低于预设的阈值时,采用误差反向传播的方法,获得各层参数的变化量并更新所述目标检测网络的参数;步骤B40,采用所述更新后的目标检测网络按批次顺序检测标准化训练图像集,并采用步骤B30的方法迭代更新所述目标检测网络的参数,直至达到预设的训练次数或者所述训练损失值低于预设的阈值,获得训练好的目标检测网络。3.根据权利要求2所述的基于目标检测网络的多标签物体检测方法,其特征在于,所述训练误差,其计算方法为:Loss=Errorcoord+Erroriou+Errorcls其中,Loss为训练误差,Errorcoord为坐标预测误差,Erroriou为预测边界框和真实边界框的重合度误差,Errorcls为分类误差。4.根据权利要求3所述的基于目标检测网络的多标签物体检测方法,其特征在于,所述坐标预测误差,其计算方法为:其中,λcorrd为坐标误差的权重,S2为输入图像分割的格子数量,B为每个格子生成的边界框数量,代表物体落入第i个格子的第j个边界框内,分别为边界框的中心坐标的预测值,分别为边界框的长度和宽度的预测值,xi、yi分别为边界框的中心坐标的真实值,wi、hi分别为边界框的长度和宽度的真实值。5.根据权利要求3所述的基于目标检测网络...

【专利技术属性】
技术研发人员:杨国栋田雨农李恩梁自泽谭民景奉水高子舒王昊孙苑淞陆偲蓰
申请(专利权)人:中国科学院自动化研究所
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1