行人属性分析模型的训练方法、行人属性识别方法及装置制造方法及图纸

技术编号:22689356 阅读:35 留言:0更新日期:2019-11-30 03:49
本发明专利技术实施例公开一种行人属性分析模型的训练方法及装置,包括:将行人图像,以及与所述行人图像对应的概率图输入卷积神经网络,得到预测属性;所述概率图表征在被划分出至少一个行人部件区域的所述行人图像中,每一个像素节点属于行人部件区域的概率值的集合;利用与所述行人图像对应的真实属性,以及所述预测属性,计算训练损失;如果所述训练损失收敛,则将所述卷积神经网络当前的模型参数确定为行人属性分析模型的模型参数,得到行人属性分析模型。采用上述训练方法训练得到的行人属性分析模型,其在用于识别属性未知的行人图像时,即便面对应用场景、行人姿势、摄像机角度差别较大的行人图像,也可以较为准确地从中识别出行人属性。

Training method of pedestrian attribute analysis model, pedestrian attribute recognition method and device

The embodiment of the invention discloses a training method and device for pedestrian attribute analysis model, including: inputting pedestrian image and probability map corresponding to the pedestrian image into convolution neural network to obtain prediction attribute; the probability map represents the probability that each pixel node belongs to the pedestrian component area in the pedestrian image divided into at least one pedestrian component area Set of values; use the real attributes corresponding to the pedestrian image and the prediction attributes to calculate the training loss; if the training loss converges, determine the current model parameters of the convolution neural network as the model parameters of the pedestrian attribute analysis model to obtain the pedestrian attribute analysis model. The pedestrian attribute analysis model trained by the above training method can be used to identify the pedestrian image with unknown attribute, even in the face of the application scene, pedestrian posture, camera angle difference between the pedestrian image, it can also identify the traveler attribute more accurately.

【技术实现步骤摘要】
行人属性分析模型的训练方法、行人属性识别方法及装置
本专利技术涉及图像处理
,具体涉及行人属性分析模型的训练方法和训练系统,以及行人属性识别方法及识别装置。
技术介绍
行人属性识别(Pedestrianattributerecognition)是指对图片进行处理分析,从中识别出行人属性的技术,这里,行人的属性包括体貌特征(例如身高、体重等)、穿着特征(例如上衣、裤子的类型和颜色、背包等)、人脸特征(例如年龄、性别、人种等)。目前,行人属性识别主要基于神经网络模型,一般包括模型训练和使用模型识别两个阶段。在模型训练阶段,采用带标注的图片作为神经网络模型的输入数据进行训练后,可以得到符合要求的模型参数。参数确定后的神经网络模型就是训练好的模型。在使用阶段,将待识别的图片作为训练好的神经网络模型的输入数据,得到输出数据,就可以得到从图片上识别出的行人的属性。然而,基于神经网络模型行人属性识别方法在实际应用中还存在一些问题,其之一就是行人图片的多样性导致无法准确识别出所有图片中的行人属性。具体来说,在实际应用场景中,由于监控场景、摄像机角度、行人着装和姿势等不同导致采集到的行人图片十分多样化,一个基于神经网络模型的方法在识别一些图片时效果较好,而对于另一些应用场景、摄像机角度等发生了较大变化的图片,则无法准确地从中识别出行人属性。
技术实现思路
为解决上述技术问题,本申请提供了一种用于识别行人属性的神经网络模型训练方法,以及一种利用上述训练好的神经网络模型识别行人属性的方法,以便能够准确地从多样的图片中识别出行人属性。第一方面,提供一种行人属性分析模型的训练方法,包括:将行人图像,以及与所述行人图像对应的概率图输入卷积神经网络,得到预测属性;所述概率图表征在被划分出至少一个行人部件区域的所述行人图像中,每一个像素节点属于行人部件区域的概率值的集合;利用与所述行人图像对应的真实属性,以及所述预测属性,计算训练损失;如果所述训练损失收敛,则将所述卷积神经网络当前的模型参数确定为行人属性分析模型的模型参数,得到行人属性分析模型。结合第一方面,在第一方面第一种可能的实现方式中,所述概率图的计算包括以下步骤:将行人图像输入行人解析模型,得到与所述行人图像对应的概率图;其中,所述行人解析模型为采用带真实概率图标签的训练图像训练好的全卷积神经网络。结合第一方面的第一种实现方式,在第一方面第二种可能的实现方式中,所述卷积神经网络包括第一子网络和第二子网络;所述将行人图像,以及与所述行人图像对应的概率图输入卷积神经网络,得到预测属性的步骤,包括:利用第一子网络从所述行人图像中提取出行人特征;更新所述概率图;根据更新后的概率图与所述行人特征,得到融合特征;将所述融合特征输入第二子网络,得到预测属性。结合第一方面及上述可能的实现方式,在第一方面第三种可能的实现方式中,更新所述概率图的步骤,具体包括:其中,xi为第i张行人图像;表示第i张行人图像中第s个像素节点属于第c类行人部件区域的概率值;表示更新后的概率值;表示对于第s个像素节点而言,所述第s个像素节点属于C’个行人部件区域中的第c类时,取得最大值;和/或,所述根据更新后的概率图与所述行人特征得到融合特征的步骤,具体包括:将所述更新后的概率图与所述行人特征进行卷积融合,得到第一特征;φ(xi)=[φ(xi)1,φ(xi)2,…,φ(xi)C']其中,φ(xi)c表示第i张行人图像的第c个通道的第一特征;表示更新后的第c个通道的概率值集合;表示复制更新后的第c个通道的概率值集合,使其与行人特征fb(xi)的通道数相同;表示对应位置的像素相乘;fb(xi)表示第i张行人图像的行人特征;φ(xi)表示第i张行人图像的第一特征;利用第一特征和所述行人特征得到融合特征。结合第一方面及上述可能的实现方式,在第一方面第四种可能的实现方式中,利用与所述行人图像对应的真实属性,以及所述预测属性,计算训练损失的步骤,具体包括:J(θ)=∑jλjJ(θj)其中,J(θ)为训练总损失;J(θj)为第j个任务的训练损失;λj表示第j个任务的任务权重;表示第j个任务中预测时的不确定性的方差;m表示第j个任务中用于训练的行人图像总数;Kj表示第j个属性的取值的选项数量;表示第i张行人图像在第j个任务中的真实属性;Pij表示第i张行人图像在第j个任务中的预测属性。第二方面,提供一种行人属性分析模型的训练方法,包括:将行人图像输入卷积神经网络,得到预测属性;利用与所述行人图像对应的真实属性,以及所述预测属性,计算训练损失:J(θ)=∑jλjJ(θj)其中,J(θ)为训练总损失;J(θj)为第j个任务的训练损失;λj表示第j个任务的任务权重;表示第j个任务中预测时的不确定性的方差;m表示第j个任务中用于训练的行人图像总数;Kj表示第j个属性的取值的选项数量;表示第i张行人图像在第j个任务中的真实属性;Pij表示第i张行人图像在第j个任务中的预测属性;如果所述训练损失收敛,则将所述卷积神经网络当前的模型参数确定为行人属性分析模型的模型参数,得到行人属性分析模型。第三方面,提供一种行人属性识别方法,包括以下步骤:将待识别的行人图像输入第一方面或第二方面任一种训练方法所训练得到的行人属性分析模型中,得到识别出的行人属性。第四方面,提供一种行人属性分析模型训练系统,包括:第一训练单元,用于将行人图像,以及与所述行人图像对应的概率图输入卷积神经网络,得到预测属性;利用与所述行人图像对应的真实属性,以及所述预测属性,计算训练损失;及,在所述训练损失收敛的情况下,将所述卷积神经网络当前的模型参数确定为行人属性分析模型的模型参数,得到行人属性分析模型;其中,所述概率图表征在被划分出至少一个行人部件区域的所述行人图像中,每一个像素节点属于行人部件区域的概率值的集合。第五方面,提供一种行人属性分析模型训练系统,包括:第二训练单元,用于将行人图像输入卷积神经网络,得到预测属性;利用与所述行人图像对应的真实属性,以及所述预测属性,计算训练损失;以及在所述训练损失收敛的情况下,将所述卷积神经网络当前的模型参数确定为行人属性分析模型的模型参数,得到行人属性分析模型;所述第二训练单元包括:第二权重自更新单元,用于根据以下公式调整与任务对应的任务权重:其中,λj表示第j个任务的任务权重;表示第j个任务中预测时的不确定性的方差;m表示第j个任务中用于训练的行人图像总数;Kj表示第j个属性的取值的选项数量;表本文档来自技高网...

【技术保护点】
1.一种行人属性分析模型的训练方法,其特征在于,包括:/n将行人图像,以及与所述行人图像对应的概率图输入卷积神经网络,得到预测属性;所述概率图表征在被划分出至少一个行人部件区域的所述行人图像中,每一个像素节点属于行人部件区域的概率值的集合;/n利用与所述行人图像对应的真实属性,以及所述预测属性,计算训练损失;/n如果所述训练损失收敛,则将所述卷积神经网络当前的模型参数确定为行人属性分析模型的模型参数,得到行人属性分析模型。/n

【技术特征摘要】
1.一种行人属性分析模型的训练方法,其特征在于,包括:
将行人图像,以及与所述行人图像对应的概率图输入卷积神经网络,得到预测属性;所述概率图表征在被划分出至少一个行人部件区域的所述行人图像中,每一个像素节点属于行人部件区域的概率值的集合;
利用与所述行人图像对应的真实属性,以及所述预测属性,计算训练损失;
如果所述训练损失收敛,则将所述卷积神经网络当前的模型参数确定为行人属性分析模型的模型参数,得到行人属性分析模型。


2.根据权利要求1所述的训练方法,其特征在于,所述概率图的计算包括以下步骤:
将行人图像输入行人解析模型,得到与所述行人图像对应的概率图;其中,所述行人解析模型为采用带真实概率图标签的训练图像训练好的全卷积神经网络。


3.根据权利要求1所述的训练方法,其特征在于,所述卷积神经网络包括第一子网络和第二子网络;
所述将行人图像,以及与所述行人图像对应的概率图输入卷积神经网络,得到预测属性的步骤,包括:
利用第一子网络从所述行人图像中提取出行人特征;
更新所述概率图;
根据更新后的概率图与所述行人特征得到融合特征;
将所述融合特征输入第二子网络,得到预测属性。


4.根据权利要求3所述的训练方法,其特征在于,更新所述概率图的步骤,具体包括:



其中,xi为第i张行人图像;

表示第i张行人图像中第s个像素节点属于第c类行人部件区域的概率值;

表示更新后的概率值;

表示对于第s个像素节点而言,所述第s个像素节点属于C’个行人部件区域中的第c类时,取得最大值;
和/或,
所述根据更新后的概率图与所述行人特征得到融合特征的步骤,具体包括:
将所述更新后的概率图与所述行人特征进行卷积融合,得到第一特征:



φ(xi)=[φ(xi)1,φ(xi)2,…,φ(xi)C']
其中,φ(xi)c表示第i张行人图像的第c个通道的第一特征;

表示更新后的第c个通道的概率值集合;

表示复制更新后的第c个通道的概率值集合,使其与行人特征fb(xi)的通道数相同;

表示对应位置的像素相乘;
fb(xi)表示第i张行人图像的行人特征;
φ(xi)表示第i张行人图像的第一特征;
利用第一特征和所述行人特征得到融合特征。


5.根据权利要求1-4任一项所述的训练方法,其特征在于,利用与所述行人图像对应的真实属性,以及所述预测属性,计算训练损失的步骤,具体包括:
J(θ)=ΣjλjJ(θj)



其中,J(θ)为训练总损失;
J(θj)为第j个任务的训练损失;
λj表示第j个任务的任务权重;

表示第j个任务中预测时的不确定性的方差;
m表示第j个任务中用于训练的行人图像总数;
Kj表示第j个属性的取值的选项数量;

表示第i张行人图像在第j个任务中的真实属性;

【专利技术属性】
技术研发人员:王睿
申请(专利权)人:北京中科奥森数据科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1