一种行人属性识别方法及系统、存储介质及终端技术方案

技术编号：24208315 阅读：45 留言：0更新日期：2020-05-20 15:40

本发明专利技术提供一种行人属性识别方法及系统、存储介质及终端，包括自监督学习阶段和推理阶段；自监督学习阶段包括提取训练图片的人体骨骼关键点；根据人体骨骼关键点提取人体分块的候选框；获取各个候选框与自然语义对应的二值属性掩码；提取训练图片的三维特征图；基于自监督学习算法训练从三维特征图提取人体分块的热力图；根据三维特征图和热力图生成人体分块的分块特征图；根据每个分块特征图生成对应的标签概率集合；根据标签概率集合和所述二值属性掩码生成行人属性识别结果；所述推理阶段根据所述自监督学习阶段获取的模型进行行人属性识别。本发明专利技术的行人属性识别方法及系统、存储介质及终端能够准确识别行人属性且有效降低网络计算复杂度。

A pedestrian attribute recognition method and its system, storage medium and terminal

全部详细技术资料下载

【技术实现步骤摘要】
一种行人属性识别方法及系统、存储介质及终端
本专利技术涉及属性识别的
，特别是涉及一种行人属性识别方法及系统、存储介质及终端。
技术介绍
行人属性是对行人外观特征、生理特征以及隐藏特征的可搜索的自然语言描述，例如衣着、肤色、年龄、性别等等。行人属性识别旨在识别图像中目标人物的各种属性，其核心思路可表述为：给定行人图像I，从预定义的属性标签集T＝{t1，t2，t3……tn}中提取一个子集来描述图像中人物具有的各种属性特征。行人属性识别是计算机视觉的一个重要方向，广泛应用于视频监控、行人重识别、人脸识别、身份验证等领域。行人属性识别属于多标签分类问题，但属性的多样性以及图像由于光线、角度、镜头分辨率等造成的模糊、遮挡、数据分布不均衡等客观因素，对行人属性识别的效果产生了巨大的影响。具体地，行人属性识别主要存在以下几个问题：(1)行人的各种属性大小、形状存在巨大的差异，因此有的属性需要浅层特征，而有的属性需要高层特征，有的属性需要局部特征，有的属性需要全局特征才能识别。因此，如何提取一个能够包括所有不同属性的特征是非常重要的问题。(2)同一个属性往往在不同的位置出现，如背包在人体上具有多个位置。因此，如何消除不同样本间属性位置不同带来的影响就非常重要。现有技术中，行人属性识别通过人工提取特征，并针对每个不同的属性分别训练分类器。典型的例子有方向梯度直方图(HistogramofOrientedGradient，HOG)、尺度不变特征变换(Scale-invariantfeatu...

【技术保护点】
1.一种行人属性识别方法，其特征在于：包括自监督学习阶段和推理阶段；/n所述自监督学习阶段包括：/n提取训练图片的人体骨骼关键点；/n根据所述人体骨骼关键点提取人体分块的候选框；/n获取各个候选框与自然语义对应的二值属性掩码；/n提取所述训练图片的三维特征图；/n基于自监督学习算法训练从所述三维特征图提取人体分块的热力图，所述热力图与所述候选框一一对应；/n根据所述三维特征图和所述热力图生成人体分块的分块特征图；/n根据每个分块特征图生成对应的标签概率集合；/n根据所述标签概率集合和所述二值属性掩码生成行人属性识别结果；/n所述推理阶段包括：/n提取输入图片的三维特征图；/n基于训练好的自监督学习算法根据三维特征图提取人体分块的热力图；/n根据所述三维特征图和所述热力图生成人体分块的分块特征图；/n根据每个分块特征图生成对应的标签概率集合；/n获取所述输入图片的各个人体分块的与自然语义对应的二值属性掩码；/n根据所述标签概率集合和二值属性掩码生成行人属性识别结果。/n

【技术特征摘要】
1.一种行人属性识别方法，其特征在于：包括自监督学习阶段和推理阶段；
所述自监督学习阶段包括：
提取训练图片的人体骨骼关键点；
根据所述人体骨骼关键点提取人体分块的候选框；
获取各个候选框与自然语义对应的二值属性掩码；
提取所述训练图片的三维特征图；
基于自监督学习算法训练从所述三维特征图提取人体分块的热力图，所述热力图与所述候选框一一对应；
根据所述三维特征图和所述热力图生成人体分块的分块特征图；
根据每个分块特征图生成对应的标签概率集合；
根据所述标签概率集合和所述二值属性掩码生成行人属性识别结果；
所述推理阶段包括：
提取输入图片的三维特征图；
基于训练好的自监督学习算法根据三维特征图提取人体分块的热力图；
根据所述三维特征图和所述热力图生成人体分块的分块特征图；
根据每个分块特征图生成对应的标签概率集合；
获取所述输入图片的各个人体分块的与自然语义对应的二值属性掩码；
根据所述标签概率集合和二值属性掩码生成行人属性识别结果。

2.根据权利要求1所述的行人属性识别方法，其特征在于：在所述自监督学习阶段，基于深度学习的DeepPose网络、DensePose网络或Openpose网络提取所述人体骨骼关键点；在所述自监督学习阶段和所述推理阶段，基于卷积神经网络、ResNet网络或MobileNet网络提取所述三维特征图；在所述自监督学习阶段，基于RPN网络提权所述候选框。

3.根据权利要求1所述的行人属性识别方法，其特征在于：设定C＝{c0，c1，......，cN-1}为行人属性标签，所述二值属性掩码为R＝{r0，r1，......，rM-1}，其中ri＝{r(i，0)，r(i，1)，r(i，2)……r(i，N-1)}，0≤i≤M-1；
0≤j≤N-1；M和N均为自然数。

4.根据权利要求1所述的行人属性识别方法，其特征在于：基于自监督学习算法训练从所述三维特征图提取人体分块的热力图包括以下步骤：
基于每个候选框生成一张二值热力标签图，所述二值热力标签图中坐标在所述候选框内的像素值设为1，在所述候选框外的像素值设为0；
将所述三维特征图输入一层卷积核大小为1*1的卷积层得到一个通道数为候选框个数的特征图；将所述特征图输入Sigmoid激活层得到所述候选框个数张热力图；
将所述热力标签图缩放到所述热力图的大小，以实现所述热力图和所述热力标签图上点的一一对应，将所述热力图和所述热力标签图逐像素计算logistic回归损失，求和得出所述训练照片的损失值，再反向传播所述损失值，更新提取所述热力图和所述三维特征图的神经网络参数；
重复进行数据训练，以使所述热力图与所述候选框相拟合。

5.根据权利要求1所述的行人属性识别方法，其特征在于：根据所述三维特征图和所述热力图生成人体分块的分块特征图时，将所述热力图与所述三维特征图在空间...

【专利技术属性】
技术研发人员：王海涛，成西锋，袁德胜，姚磊，张宏俊，王作辉，游浩泉，刘耀文，吴贺丰，
申请(专利权)人：汇纳科技股份有限公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人