The application discloses a target object recognition method, device, device and storage medium, the method includes: according to the size of the detection window and the step length of the detection window, the first picture is divided into a plurality of first sub pictures, and the gradient feature information of each first sub picture is obtained. The gradient feature information is used as the input of the image pre recognition model, and the first object type information of the target object on the first subpicture is output from the image pre recognition model. If the first object type information is the preset object type information, determine the location information of the target object on the first sub picture, and determine the location information set of the target object set on the first picture; obtain the feature plane of the first picture, take the feature plane and location information set as the input of the picture recognition model, and output the location information set on the location information set from the picture recognition model The second object type information of the object set can improve the recognition rate by the pedestrian recognition process based on the preliminary object recognition results.
【技术实现步骤摘要】
一种目标对象识别方法、装置、设备以及存储介质
本申请涉及图像识别
,尤其涉及一种目标对象识别方法、装置、设备及存储介质。
技术介绍
随着多媒体技术和互联网技术的发展,行人识别也是近年来计算机视觉领域的热门研究对象,在智能交通、寻人、安全方面都有广阔的应用前景。在智能交通方面,为了减少汽车与行人碰撞事故的发生,有效的保护行人安全,国内,国外在制定严格的行人保护法规之外,在汽车的被动安全与主动安全等方面也进行了相关的研究。行人主动防碰撞系统是汽车主动安全系统中的重要组成部扥,该系统能在发现车辆前方的行人处于危险状态时能及时警告驾驶员,避免与其发生碰撞,也能主动采取紧急制动或者转向等措施以避免碰撞事故的发生。行人主动防碰撞系统包括行人识别系统,行人识别的一种传统识别算法为人工神经网络,它从信息处理角度对人脑神经元网络进行抽象,建立一种简单模型。基于人工神经网络的训练算法为反向传播算法,它使得网络模型经过大量训练样本进行学习的过程能过获得统计规律,从而对未知事件做出推测。人工神经网络优点在于具有较强的非线性映射能力、自学习、自适应能力、泛化能力和一定的容错能力。然而,人工神经网络也存在以下缺点:在行人识别样本训练时收敛速度慢,且其训练过程为监督过程,而对训练样本的标注既费时又费力,并且行人识别涉及到大量数据的计算和分析,外加受到环境因素的感染,使得传统识别算法的识别率较低,无法在复杂环境下进行有效的识别。
技术实现思路
本申请实施例提供了一种目标对象识别方法、装置、设备及存储介质,可 ...
【技术保护点】
1.一种目标对象识别方法,其特征在于,包括:/n根据检测窗口的尺寸和所述检测窗口的步长,将第一图片分为多张第一子图片;/n获取所述多张第一子图片中每张第一子图片的梯度特征信息;/n将所述梯度特征信息作为图片预识别模型的输入,从所述图片预识别模型输出所述多张第一子图片上目标对象的第一对象类型信息;/n若所述第一对象类型信息为预设对象类型信息,确定所述目标对象在所述第一子图片上的位置信息,并确定所述第一图片上目标对象集合的位置信息集合;所述目标对象集合包括所述多张第一子图片上的目标对象;/n获取所述第一图片的特征平面,将所述特征平面和所述位置信息集合作为图片再识别模型的输入,从所述图片再识别模型输出位于所述位置信息集合上的目标对象集合的第二对象类型信息。/n
【技术特征摘要】 【专利技术属性】
1.一种目标对象识别方法,其特征在于,包括:
根据检测窗口的尺寸和所述检测窗口的步长,将第一图片分为多张第一子图片;
获取所述多张第一子图片中每张第一子图片的梯度特征信息;
将所述梯度特征信息作为图片预识别模型的输入,从所述图片预识别模型输出所述多张第一子图片上目标对象的第一对象类型信息;
若所述第一对象类型信息为预设对象类型信息,确定所述目标对象在所述第一子图片上的位置信息,并确定所述第一图片上目标对象集合的位置信息集合;所述目标对象集合包括所述多张第一子图片上的目标对象;
获取所述第一图片的特征平面,将所述特征平面和所述位置信息集合作为图片再识别模型的输入,从所述图片再识别模型输出位于所述位置信息集合上的目标对象集合的第二对象类型信息。
2.根据权利要求1所述的方法,其特征在于,所述获取所述多张第一子图片中每张第一子图片的梯度特征信息,包括:
根据第一区域的尺寸和所述第一区域的步长,将所述第一子图片分为多个第一区域;其中,每个第一区域包括多个第二区域;
根据所述每个第二区域内包含的每个像素的灰度值确定所述像素的梯度幅值和梯度方向,以及根据所述梯度方向和梯度幅值确定所述第二区域的梯度直方图;
根据所述第一区域包含的每个第二区域的梯度直方图确定所述第一区域的梯度特征信息;
以及根据所述多个第一区域的梯度特征信息确定出所述第一子图片的梯度特征信息。
3.根据权利要求2所述的方法,其特征在于,所述图片预识别模型采用下述方式确定:
获取多张第二子图片的梯度特征信息;
确定所述第二子图片上目标对象的第一对象类型信息;
将所述第二子图片的梯度特征信息作为第一输入,将所述第二子图片上目标对象的第一对象类型信息作为第一输出,进行模型训练,获得所述图片预识别模型。
4.根据权利要求1所述的方法,其特征在于,所述图片再识别模型包括:
输入层、2个卷积层、4个下采样层、9个混合层、1个最大池化层、1个全连接层和输出层。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
所述9个混合层中的每个混合层包括4个支路;
针对一个混合层:输入所述混合层的第一特征平面分别与所述混合层的4个支路中的每个支路的卷积核和/或池化窗口进行计算得到所述每个支路对应的第二子特征平面;
根据所述第二子特征平面确定输出所述混合层的第二特征平面。
技术研发人员:许成舜,施亮,张骋,
申请(专利权)人:浙江吉利控股集团有限公司,浙江吉利汽车研究院有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。