一种基于深度神经网络的行人属性识别方法、装置及存储介质制造方法及图纸

技术编号:21454525 阅读:31 留言:0更新日期:2019-06-26 04:57
本发明专利技术提供了一种基于深度神经网络的行人属性识别方法、装置及存储介质,该方法包括:获取步骤,获取待识别的行人图像;检测步骤,使用第一深度神经网络模型对行人图像进行人体部位检测,获得人体部位信息和附属物信息;识别步骤,使用第二深度神经网络模型对人体部位信息和附属物信息进行识别得到行人属性信息。本发明专利技术通过第一深度神经网络模型获得人体部位信息和附属物信息,然后再使用第二深度神经网络模型对所述人体部位信息和附属物信息进行识别得到行人属性信息,即本发明专利技术中采用由粗到细对行人进行精细识别,并在第二深度神经网络模型设计了对人体部位及附属物进行局部细粒度属性识别的局部处理块,提高了人体部位和附属物识别的准确度。

【技术实现步骤摘要】
一种基于深度神经网络的行人属性识别方法、装置及存储介质
本专利技术涉及数据人工智能
,特别是一种基于深度神经网络的行人属性识别方法、装置及存储介质。
技术介绍
随着信息技术迅速的发展,现如今监控系统在各行业应用日渐广泛,如车站、商场、公园、学校、公司等公共场所都安装着大量的监控摄像头,这些摄像头实时监控着行人的一举一动,为相关部门的人员管理,案件侦破提供有利线索。面对如此多的摄像头如果仅仅是靠人工监控无疑是一项艰巨的任务。于是研究通过计算机视觉技术实现自动视频图像识别是一个非常有意义的课题。传统的图像识别技术一般都是人工手动设计特征,根据特征对图像进行分类完成识别任务。早期主要基于人工设计特征,如方向梯度直方图(HOG)等,然后采用支持向量机等分类器对提取的特征进行分类识别。近年来特别是随着计算机视觉社区中深度卷积神经网络研究的不断深入,基于深度神经网络在图像识别中的研究是主流。基于卷积神经网络对行人属性识别方法,一般是抠出行人样本,输入到CNN分类器,输出多个行人属性标签。现有技术中存在一些难以解决的问题,提取的特征对训练数据具有依赖性,不易泛化到其他数据,计算开销太大,延时较高。深度学习能自动提取隐藏在数据间的多层特征表示,已经成功应用于图像识别与分类,分割等领域。通过卷积神经网络对图像进行整体分类方式,结构简单、训练方便,然而总体的准确性很难提高,尤其是对较小的局部属性识别,比如是否带眼镜,鞋子类型等识别度都比较低,当属性类别较多时也很容易造成各类别识别精度不均衡问题。现有技术中的分割方法和网络设计上在实际应用中准确率仍有待提高,尤其是对携带物的识别都较为粗糙。
技术实现思路
本专利技术针对上述现有技术中的缺陷,提出了如下技术方案。一种基于深度神经网络的行人属性识别方法,该方法包括:获取步骤,获取待识别的行人图像;检测步骤,使用第一深度神经网络模型对所述行人图像进行人体部位检测,获得人体部位信息和附属物信息;识别步骤,使用第二深度神经网络模型对所述人体部位信息和附属物信息进行识别得到行人属性信息。更进一步地,人体部位包括:头部、上身、全身、下身和脚部。更进一步地,所述第二深度神经网络模型包括头部识别模型、上身识别模型、全身识别模型、下身识别模型、脚部识别模型和附属物识别模型。更进一步地,将所述行人图像划分为S*S个格子,使用所述第一深度神经网络模型检测人体部位落在格子中的范围以确定人体部位信息,其中,人体部位信息为人体部位在所述行人图像中的位置,所述第一深度神经网络模型的卷积核用3*1和1*3大小的卷积核。更进一步地,所述第二深度神经网络模型包括依次连接的第一卷积层、第一最大池化层、第二卷积层、第三卷积层、第二最大池化层、六个局部处理块、平均池化层、丢弃层和多个softmax分类器(例如两个softmax分类器);其中,第一卷积层的卷积核大小为5*5,第二卷积层的卷积核大小为1*1,第三卷积层的卷积核大小为3*3;其中,所述局部处理块包括:第一过滤连接层、第四卷积层和第二过滤连接层,所述第四卷积层的输入与所述第一过滤连接层连接,所述第四卷积层的输出与所述第二过滤连接层连接;所述局部处理块还包括:第五卷积层、第六卷积层和第七卷积层,所述第五卷积层的输入与所述第一过滤连接层连接,所述第七卷积层的输出与所述第二过滤连接层连接,所述第六卷积层的输入和输出与第五卷积层的输出和第七卷积层的输入相连接;所述局部处理块还包括:第三最大池化层和第八卷积层,所述第三最大池化层的输入与所述第一过滤连接层连接,所述第八卷积层的输出与所述第二过滤连接层连接,所述第三最大池化层的输出和所述第八卷积层的输出相连接;其中,第四卷积层的卷积核大小为1*1,第五卷积层的卷积核大小为1*1,第六卷积层的卷积核大小为3*3,第七卷积层的卷积核大小为3*3,第八卷积层的卷积核大小为1*1。更进一步地,对所述第一深度神经网络模型进行训练的参数为:图像输入大小为416*416、训练批次大小为64、学习率为0.001和动量为0.9;对所述第二深度神经网络模型进行训练的参数为:训练批次大小为64、学习率为0.001。本专利技术还提出了一种基于深度神经网络的行人属性识别装置,该装置包括:获取单元,用于获取待识别的行人图像;检测单元,使用第一深度神经网络模型对所述行人图像进行人体部位检测,获得人体部位信息和附属物信息;识别单元,使用第二深度神经网络模型对所述人体部位信息和附属物信息进行识别得到行人属性信息。更进一步地,人体部位包括:头部、上身、全身、下身和脚部。更进一步地,所述第二深度神经网络模型包括头部识别模型、上身识别模型、全身识别模型、下身识别模型、脚部识别模型和附属物识别模型。更进一步地,将所述行人图像划分为S*S个格子,使用所述第一深度神经网络模型检测人体部位落在格子中的范围以确定人体部位信息,其中,人体部位信息为人体部位在所述行人图像中的位置,所述第一深度神经网络模型的卷积核用3*1和1*3大小的卷积核。更进一步地,所述第二深度神经网络模型包括依次连接的第一卷积层、第一最大池化层、第二卷积层、第三卷积层、第二最大池化层、六个局部处理块、平均池化层、丢弃层和多个softmax分类器(例如两个softmax分类器);其中,第一卷积层的卷积核大小为5*5,第二卷积层的卷积核大小为1*1,第三卷积层的卷积核大小为3*3;其中,所述局部处理块包括:第一过滤连接层、第四卷积层和第二过滤连接层,所述第四卷积层的输入与所述第一过滤连接层连接,所述第四卷积层的输出与所述第二过滤连接层连接;所述局部处理块还包括:第五卷积层、第六卷积层和第七卷积层,所述第五卷积层的输入与所述第一过滤连接层连接,所述第七卷积层的输出与所述第二过滤连接层连接,所述第六卷积层的输入和输出与第五卷积层的输出和第七卷积层的输入相连接;所述局部处理块还包括:第三最大池化层和第八卷积层,所述第三最大池化层的输入与所述第一过滤连接层连接,所述第八卷积层的输出与所述第二过滤连接层连接,所述第三最大池化层的输出和所述第八卷积层的输出相连接;其中,第四卷积层的卷积核大小为1*1,第五卷积层的卷积核大小为1*1,第六卷积层的卷积核大小为3*3,第七卷积层的卷积核大小为3*3,第八卷积层的卷积核大小为1*1。更进一步地,对所述第一深度神经网络模型进行训练的参数为:图像输入大小为416*416、训练批次大小为64、学习率为0.001和动量为0.9;对所述第二深度神经网络模型进行训练的参数为:训练批次大小为64、学习率为0.001。本专利技术还提出了一种计算机可读存储介质,所述存储介质上存储有计算机程序代码,当所述计算机程序代码被计算机执行时执行上述之任一的方法。本专利技术的技术效果为:本专利技术通过第一深度神经网络模型对行人图像进行人体部位检测,获得人体部位信息和附属物信息,然后再使用第二深度神经网络模型对所述人体部位信息和附属物信息进行识别得到行人属性信息,即本专利技术中采用由粗到细对行人进行精细识别,并在第二深度神经网络模型设计了对人体部位及附属物进行局部细粒度属性识别的局部处理块,提高了人体部位和附属物识别的准确度。该识别方法具有较低的延时,对目前辅助监控有很大的帮助。附图说明通过阅读参照以下附图所作的对非本文档来自技高网
...

【技术保护点】
1.一种基于深度神经网络的行人属性识别方法,其特征在于,该方法包括:获取步骤,获取待识别的行人图像;检测步骤,使用第一深度神经网络模型对所述行人图像进行人体部位检测,获得人体部位信息和附属物信息;识别步骤,使用第二深度神经网络模型对所述人体部位信息和附属物信息进行识别得到行人属性信息。

【技术特征摘要】
1.一种基于深度神经网络的行人属性识别方法,其特征在于,该方法包括:获取步骤,获取待识别的行人图像;检测步骤,使用第一深度神经网络模型对所述行人图像进行人体部位检测,获得人体部位信息和附属物信息;识别步骤,使用第二深度神经网络模型对所述人体部位信息和附属物信息进行识别得到行人属性信息。2.根据权利要求1所述的方法,其特征在于,人体部位包括:头部、上身、全身、下身和脚部。3.根据权利要求2所述的方法,其特征在于,所述第二深度神经网络模型包括头部识别模型、上身识别模型、全身识别模型、下身识别模型、脚部识别模型和附属物识别模型。4.根据权利要求1所述的方法,其特征在于,将所述行人图像划分为S*S个格子,使用所述第一深度神经网络模型检测人体部位落在格子中的范围以确定人体部位信息,其中,人体部位信息为人体部位在所述行人图像中的位置,所述第一深度神经网络模型的卷积核用3*1和1*3大小的卷积核。5.根据权利要求4所述的方法,其特征在于,所述第二深度神经网络模型包括依次连接的第一卷积层、第一最大池化层、第二卷积层、第三卷积层、第二最大池化层、六个局部处理块、平均池化层、丢弃层和多个softmax分类器;其中,第一卷积层的卷积核大小为5*5,第二卷积层的卷积核大小为1*1,第三卷积层的卷积核大小为3*3;其中,所述局部处理块包括:第一过滤连接层、第四卷积层和第二过滤连接层,所述第四卷积层的输入与所述第一过滤连接层连接,所述第四卷积层的输出与所述第二过滤连接层连接;所述局部处理块还包括:第五卷积层、第六卷积层和第七卷积层,所述第五卷积层的输入与所述第一过滤连接层连接,所述第七卷积层的输出与所述第二过滤连接层连接,所述第六卷积层的输入和输出与第五卷积层的输出和第七卷积层的输入相连接;所述局部处理块还包括:第三最大池化层和第八卷积层,所述第三最大池化层的输入与所述第一过滤连接层连接,所述第八卷积层的输出与所述第二过滤连接层连接,所述第三最大池化层的输出和所述第八卷积层的输出相连接;其中,第四卷积层的卷积核大小为1*1,第五卷积层的卷积核大小为1*1,第六卷积层的卷积核大小为3*3,第七卷积层的卷积核大小为3*3,第八卷积层的卷积核大小为1*1。6.根据权利要求5所述的方法,其特征在于,对所述第一深度神经网络模型进行训练的参数为:图像输入大小为416*416、训练批次大小为64、学习率为0.001和动量为0.9;对所述第二深度神经网络模型进行训练的参数为:训练批次大小为64、学习率为0.001。7.一种基于深度神经网络的行人属性识别装置,其特征在于,该装置包括:获取单元,...

【专利技术属性】
技术研发人员:纪长进郑少明郭任煌郑汉军陈思德李剑煜邱锋兴黄惠海罗佳王毅宏
申请(专利权)人:厦门安胜网络科技有限公司
类型:发明
国别省市:福建,35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1