The invention belongs to the field of computer vision, and specifically relates to a multi-label object detection method, system and device based on the target detection network, aiming at solving the problem that the existing target detection technology has low accuracy and can not solve the problem of real-time and accurate detection of multi-label objects. The method of the invention includes: acquiring the image of the object to be detected as the input image; using the trained target detection network, acquiring the category of the object to be detected and the central coordinates of the object to be detected, the length and width of the rectangular box to be detected; outputting the category of the object to be detected, the central coordinates of the object to be detected, and the length and width of the rectangular box to be detected. The method realizes real-time and accurate detection of different kinds of targets, improves the speed and accuracy of detection, and can deal with overlapping and occlusion situations in target detection.
【技术实现步骤摘要】
基于目标检测网络的多标签物体检测方法、系统、装置
本专利技术属于计算机视觉领域,具体涉及了一种基于目标检测网络的多标签物体检测方法、系统、装置。
技术介绍
随着人工智能、机器学习技术的迅速发展和日趋成熟,自主目标检测技术成为了近年来国内外深度学习研究的热点问题,在智能交通、医学图像处理、机器人技术、农业物联网方面拥有着广泛的应用前景。现实生活中,物体种类繁多、个体分布方式复杂,人类可以通过感知物体形状、颜色、纹理和距离等信息,准确判断物体的类别和位置,但这对于计算机视觉来说是极大的挑战。因此,使计算机拥有与人类相似甚至超过人类的目标检测能力,已经成为当前目标检测技术的重要方向和主要挑战。目标检测的主要研究方法是提取目标颜色、形状、纹理等特征实现目标描述,然后利用一定的机器学习算法进行目标类型和目标位置、轮廓的学习,最后对目标进行分类、定位及画框,实现目标检测。但是待检测的目标存在类内差异大、类间相似度高的情况,这种情况下提取的特征通常很难反映出类间差异和类内共性。尤其在物体具有多个标签的情况下,由于传统特征提取方式的限制,不同标签所使用的特征之间往往是没有关联的,这使物体识别起来更加困难。在实际目标检测的过程中,目标物之间的相互重叠、存在遮挡等情况使得目标类间分类边界不明显,类内区分困难,这也对目标的实际检测带来很大的挑战。多标签物体检测问题目前主要依靠两种类型的方法来处理。一种是基于传统图像处理的方法,首先对物体图像提取一些Haar、SIFT、HOG、SURF、DPM等特征,然后采用传统的分类器获取物体类别的预测结果及位置信息,该方法的识别速度比较快,但 ...
【技术保护点】
1.一种基于目标检测网络的多标签物体检测方法,其特征在于,包括:步骤S10,获取待检测物体的图像作为输入图像;步骤S20,基于训练后的目标检测网络,依据所述输入图像,获取待检测物体的类别以及待检测物体中心坐标、检测矩形框长度和宽度;步骤S30,输出待检测物体的类别以及待检测物体中心坐标、检测矩形框长度和宽度;其中,所述的目标检测网络,为采用密集连接卷积网络替代YOLO‑V3网络中分辨率低的特征层所得到的网络。
【技术特征摘要】
1.一种基于目标检测网络的多标签物体检测方法,其特征在于,包括:步骤S10,获取待检测物体的图像作为输入图像;步骤S20,基于训练后的目标检测网络,依据所述输入图像,获取待检测物体的类别以及待检测物体中心坐标、检测矩形框长度和宽度;步骤S30,输出待检测物体的类别以及待检测物体中心坐标、检测矩形框长度和宽度;其中,所述的目标检测网络,为采用密集连接卷积网络替代YOLO-V3网络中分辨率低的特征层所得到的网络。2.根据权利要求1所述的基于目标检测网络的多标签物体检测方法,其特征在于,所述目标检测网络的训练步骤为:步骤B10,将获取的训练图像集中每一个图像根据标准格式调整图像属性,获得标准化训练图像集;步骤B20,采用所述目标检测网络检测标准化训练图像集中一个批次的图像,并计算所述目标检测网络各分类器的训练误差值;步骤B30,当未达到预设的训练次数或者所述训练误差值不低于预设的阈值时,采用误差反向传播的方法,获得各层参数的变化量并更新所述目标检测网络的参数;步骤B40,采用所述更新后的目标检测网络按批次顺序检测标准化训练图像集,并采用步骤B30的方法迭代更新所述目标检测网络的参数,直至达到预设的训练次数或者所述训练损失值低于预设的阈值,获得训练好的目标检测网络。3.根据权利要求2所述的基于目标检测网络的多标签物体检测方法,其特征在于,所述训练误差,其计算方法为:Loss=Errorcoord+Erroriou+Errorcls其中,Loss为训练误差,Errorcoord为坐标预测误差,Erroriou为预测边界框和真实边界框的重合度误差,Errorcls为分类误差。4.根据权利要求3所述的基于目标检测网络的多标签物体检测方法,其特征在于,所述坐标预测误差,其计算方法为:其中,λcorrd为坐标误差的权重,S2为输入图像分割的格子数量,B为每个格子生成的边界框数量,代表物体落入第i个格子的第j个边界框内,分别为边界框的中心坐标的预测值,分别为边界框的长度和宽度的预测值,xi、yi分别为边界框的中心坐标的真实值,wi、hi分别为边界框的长度和宽度的真实值。5.根据权利要求3所述的基于目标检测网络...
【专利技术属性】
技术研发人员:杨国栋,田雨农,李恩,梁自泽,谭民,景奉水,高子舒,王昊,孙苑淞,陆偲蓰,
申请(专利权)人:中国科学院自动化研究所,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。