一种目标对象识别方法、装置、设备以及存储介质制造方法及图纸

技术编号:22565503 阅读:43 留言:0更新日期:2019-11-16 12:11
本申请公开了一种目标对象识别方法、装置、设备及存储介质,所述方法包括:根据检测窗口的尺寸和检测窗口的步长,将第一图片分为多张第一子图片,获取每张第一子图片的梯度特征信息。将梯度特征信息作为图片预识别模型的输入,从图片预识别模型输出多张第一子图片上目标对象的第一对象类型信息。若第一对象类型信息为预设对象类型信息,确定目标对象在第一子图片上的位置信息,确定第一图片上目标对象集合的位置信息集合;获取第一图片的特征平面,将特征平面和位置信息集合作为图片再识别模型的输入,从图片再识别模型输出位于位置信息集合上的目标对象集合的第二对象类型信息,基于初步的目标对象识别结果进行行人再识别过程,可以提高识别率。

A method, device, device and storage medium for object recognition

The application discloses a target object recognition method, device, device and storage medium, the method includes: according to the size of the detection window and the step length of the detection window, the first picture is divided into a plurality of first sub pictures, and the gradient feature information of each first sub picture is obtained. The gradient feature information is used as the input of the image pre recognition model, and the first object type information of the target object on the first subpicture is output from the image pre recognition model. If the first object type information is the preset object type information, determine the location information of the target object on the first sub picture, and determine the location information set of the target object set on the first picture; obtain the feature plane of the first picture, take the feature plane and location information set as the input of the picture recognition model, and output the location information set on the location information set from the picture recognition model The second object type information of the object set can improve the recognition rate by the pedestrian recognition process based on the preliminary object recognition results.

【技术实现步骤摘要】
一种目标对象识别方法、装置、设备以及存储介质
本申请涉及图像识别
,尤其涉及一种目标对象识别方法、装置、设备及存储介质。
技术介绍
随着多媒体技术和互联网技术的发展,行人识别也是近年来计算机视觉领域的热门研究对象,在智能交通、寻人、安全方面都有广阔的应用前景。在智能交通方面,为了减少汽车与行人碰撞事故的发生,有效的保护行人安全,国内,国外在制定严格的行人保护法规之外,在汽车的被动安全与主动安全等方面也进行了相关的研究。行人主动防碰撞系统是汽车主动安全系统中的重要组成部扥,该系统能在发现车辆前方的行人处于危险状态时能及时警告驾驶员,避免与其发生碰撞,也能主动采取紧急制动或者转向等措施以避免碰撞事故的发生。行人主动防碰撞系统包括行人识别系统,行人识别的一种传统识别算法为人工神经网络,它从信息处理角度对人脑神经元网络进行抽象,建立一种简单模型。基于人工神经网络的训练算法为反向传播算法,它使得网络模型经过大量训练样本进行学习的过程能过获得统计规律,从而对未知事件做出推测。人工神经网络优点在于具有较强的非线性映射能力、自学习、自适应能力、泛化能力和一定的容错能力。然而,人工神经网络也存在以下缺点:在行人识别样本训练时收敛速度慢,且其训练过程为监督过程,而对训练样本的标注既费时又费力,并且行人识别涉及到大量数据的计算和分析,外加受到环境因素的感染,使得传统识别算法的识别率较低,无法在复杂环境下进行有效的识别。
技术实现思路
本申请实施例提供了一种目标对象识别方法、装置、设备及存储介质,可以在复杂环境下进行有效的识别,提高识别率。一方面,本申请实施例提供了一种目标对象识别方法,该方法包括:根据检测窗口的尺寸和检测窗口的步长,将该第一图片分为多张第一子图片;获取多张第一子图片中每张第一子图片的梯度特征信息;将梯度特征信息作为图片预识别模型的输入,从图片预识别模型输出多张第一子图片上目标对象的第一对象类型信息;若第一对象类型信息为预设对象类型信息,确定目标对象在第一子图片上的位置信息,并确定第一图片上目标对象集合的位置信息集合,目标对象集合包括多张第一子图片上的目标对象;获取第一图片的特征平面,将特征平面和位置信息集合作为图片再识别模型的输入,从图片再识别模型输出位于位置信息集合上的目标对象集合的第二对象类型信息。另一方面提供了一种目标对象识别装置,该装置包括:图片处理模块,用于根据检测窗口的尺寸和检测窗口的步长,将该第一图片分为多张第一子图片;梯度特征信息获取模块,用于获取多张第一子图片中每张第一子图片的梯度特征信息;图片预识别模块,用于将梯度特征信息作为图片预识别模型的输入,从图片预识别模型输出多张第一子图片上目标对象的第一对象类型信息;位置信息确定模块,用于若第一对象类型信息为预设对象类型信息,确定目标对象在第一子图片上的位置信息,并确定第一图片上目标对象集合的位置信息集合;目标对象集合包括多张第一子图片上的目标对象;图片再识别模块,用于获取第一图片的特征平面,将特征平面和位置信息集合作为图片再识别模型的输入,从图片再识别模型输出位于位置信息集合上的目标对象集合的第二对象类型信息。另一方面提供了一种目标对象识别设备,该设备包括处理器和存储器,存储器中存储有至少一条指令、至少一段程序、代码集或指令集,至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现如上述的目标对象识别方法。另一方面提供了一种计算机可读存储介质,存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现如上述的目标对象识别方法。本申请实施例提供的目标对象识别方法、装置、设备及存储介质,具有如下技术效果:根据检测窗口的尺寸和检测窗口的步长,将第一图片分为多张第一子图片,获取多张第一子图片中每张第一子图片的梯度特征信息。将梯度特征信息作为图片预识别模型的输入,从图片预识别模型输出多张第一子图片上目标对象的第一对象类型信息,从而得到初步的目标对象识别结果。若第一对象类型信息为预设对象类型信息,确定目标对象在第一子图片上的位置信息,并确定第一图片上目标对象集合的位置信息集合;目标对象集合包括多张第一子图片上的目标对象;获取第一图片的特征平面,将特征平面和位置信息集合作为图片再识别模型的输入,从图片再识别模型输出位于位置信息集合上的目标对象集合的第二对象类型信息,如此,基于初步的目标对象识别结果进行行人再识别过程,以此可以提高识别率。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。图1是本申请实施例提供的一种应用环境的示意图;图2是本申请实施例提供的一种目标对象识别方法的流程示意图;图3是本申请实施例提供的一种获取第一子图片的梯度特征信息的方法的流程示意图;图4是本申请实施例提供的一种第一子图片的示意图;图5是本申请实施例提供的一种混合层的结构示意图;图6是本申请实施例提供的一种目标对象识别装置的结构示意图;图7是本申请实施例提供的一种目标对象识别方法的服务器的硬件结构框图。具体实施方式下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。请参阅图1,图1是本申请实施例提供的一种应用环境的示意图,包括图片处理模块101、梯度特征信息获取模块102、图片预识别模型103、位置信息确定模块104和图片再识别模型105。由上述5个模块组成的整体获取第一图片后,依次经过上述5个模块输出第一图片的目标对象集合的第二对象类型信息。第一图片输入图片处理模块101,图片处理模块101根据检测窗口的尺寸和检测窗口的步长,将第一图片分为多张第一子图片,并输出该多张第一子图片至梯度特征信息获取模块102。梯度特征信息获取模块102获取多本文档来自技高网...

【技术保护点】
1.一种目标对象识别方法,其特征在于,包括:/n根据检测窗口的尺寸和所述检测窗口的步长,将第一图片分为多张第一子图片;/n获取所述多张第一子图片中每张第一子图片的梯度特征信息;/n将所述梯度特征信息作为图片预识别模型的输入,从所述图片预识别模型输出所述多张第一子图片上目标对象的第一对象类型信息;/n若所述第一对象类型信息为预设对象类型信息,确定所述目标对象在所述第一子图片上的位置信息,并确定所述第一图片上目标对象集合的位置信息集合;所述目标对象集合包括所述多张第一子图片上的目标对象;/n获取所述第一图片的特征平面,将所述特征平面和所述位置信息集合作为图片再识别模型的输入,从所述图片再识别模型输出位于所述位置信息集合上的目标对象集合的第二对象类型信息。/n

【技术特征摘要】
1.一种目标对象识别方法,其特征在于,包括:
根据检测窗口的尺寸和所述检测窗口的步长,将第一图片分为多张第一子图片;
获取所述多张第一子图片中每张第一子图片的梯度特征信息;
将所述梯度特征信息作为图片预识别模型的输入,从所述图片预识别模型输出所述多张第一子图片上目标对象的第一对象类型信息;
若所述第一对象类型信息为预设对象类型信息,确定所述目标对象在所述第一子图片上的位置信息,并确定所述第一图片上目标对象集合的位置信息集合;所述目标对象集合包括所述多张第一子图片上的目标对象;
获取所述第一图片的特征平面,将所述特征平面和所述位置信息集合作为图片再识别模型的输入,从所述图片再识别模型输出位于所述位置信息集合上的目标对象集合的第二对象类型信息。


2.根据权利要求1所述的方法,其特征在于,所述获取所述多张第一子图片中每张第一子图片的梯度特征信息,包括:
根据第一区域的尺寸和所述第一区域的步长,将所述第一子图片分为多个第一区域;其中,每个第一区域包括多个第二区域;
根据所述每个第二区域内包含的每个像素的灰度值确定所述像素的梯度幅值和梯度方向,以及根据所述梯度方向和梯度幅值确定所述第二区域的梯度直方图;
根据所述第一区域包含的每个第二区域的梯度直方图确定所述第一区域的梯度特征信息;
以及根据所述多个第一区域的梯度特征信息确定出所述第一子图片的梯度特征信息。


3.根据权利要求2所述的方法,其特征在于,所述图片预识别模型采用下述方式确定:
获取多张第二子图片的梯度特征信息;
确定所述第二子图片上目标对象的第一对象类型信息;
将所述第二子图片的梯度特征信息作为第一输入,将所述第二子图片上目标对象的第一对象类型信息作为第一输出,进行模型训练,获得所述图片预识别模型。


4.根据权利要求1所述的方法,其特征在于,所述图片再识别模型包括:
输入层、2个卷积层、4个下采样层、9个混合层、1个最大池化层、1个全连接层和输出层。


5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
所述9个混合层中的每个混合层包括4个支路;
针对一个混合层:输入所述混合层的第一特征平面分别与所述混合层的4个支路中的每个支路的卷积核和/或池化窗口进行计算得到所述每个支路对应的第二子特征平面;
根据所述第二子特征平面确定输出所述混合层的第二特征平面。

【专利技术属性】
技术研发人员:许成舜施亮张骋
申请(专利权)人:浙江吉利控股集团有限公司浙江吉利汽车研究院有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1