当前位置: 首页 > 专利查询>华侨大学专利>正文

一种基于身份和非身份属性交互学习的行人属性识别方法技术

技术编号:22689413 阅读:27 留言:0更新日期:2019-11-30 03:51
本发明专利技术提供一种基于身份和非身份属性交互学习的行人属性识别方法。首先,采用一种具有视角变化鲁棒性的特征学习方法对行人图像进行特征表达;其次,将行人属性分为身份属性和非身份属性,对二者之间的潜在关系进行建模,设计出行人身份属性和非身份属性交互学习的目标函数,利用身份属性的识别优势促进非身份属性识别率的提高,并且利用非身份属性识别率的提高反过来进一步改进身份属性的识别效果。行人属性分为身份属性和非身份属性的潜在关系为:相同身份的行人之间,必然具有相同的非身份属性;非身份属性差异大的行人之间,其身份属性差异一般较大。最后,采用mini‑batch随机梯度下降算法对目标函数进行优化,实现行人属性的识别。

A pedestrian attribute recognition method based on interactive learning of identity and non identity attributes

The invention provides a pedestrian attribute recognition method based on the interactive learning of identity and non identity attributes. Firstly, a feature learning method with robustness of perspective change is used to express the features of pedestrian image; secondly, pedestrian attributes are divided into identity attributes and non identity attributes, the potential relationship between them is modeled, the objective function of mutual learning between identity attributes and non identity attributes is designed, and the identification advantage of identity attributes is used to promote the identification of non identity attributes The improvement of the rate and the use of non identity attribute recognition rate in turn further improve the effect of identity attribute recognition. The potential relationship between pedestrian attributes, which are divided into identity attributes and non identity attributes, is that: pedestrians with the same identity must have the same non identity attributes; pedestrians with large differences in non identity attributes generally have large differences in identity attributes. Finally, the mini \u2011 batch random gradient descent algorithm is used to optimize the objective function and realize the identification of pedestrian attributes.

【技术实现步骤摘要】
一种基于身份和非身份属性交互学习的行人属性识别方法
本专利技术涉及一种基于身份和非身份属性交互学习的行人属性识别方法。
技术介绍
行人属性是指行人的一系列可描述的高级语义特征,包括行人的身份、性别、年龄、发型、衣着、配饰和携带物等。其中,身份、性别和年龄属于全局属性,而发型、配饰、衣着和携带物等是局部属性。行人属性识别是能够利用一系列高级语义行人属性,从海量大量视频中里初步筛选出符合给定属性的行人目标的一种有效的视频图像侦查手段,具有重要的科研和实战意义。同人脸识别技术相比,行人属性识别包括对全局的身份、年龄、性别属性以及局部的发型、衣着、配饰和携带物等属性的识别,用行人的多个属性组合来代替单一的人脸属性,更加全面地刻画行人,适用于更广泛的图像视频侦查场景,因此更加符合公安机关打击犯罪的现实需求,具有更广泛的应用研究价值。对于行人属性识别的研究,目前多数基于深度学习的识别方法的做法是分别给每个属性识别任务设置一个Softmax目标函数,然后对所有属性识别任务同时进行优化。但是,这种做法除了共享特征之外,各个属性识别任务之间缺乏进一步的交互,特别是身份属性与非身份属性无法进行有效地交互。其次,实际中视频监控系统常常是会有多个视角不同的摄像头同时布控的,视角的变化会同时给身份属性和非身份属性的识别造成困难,因此行人属性识别的准确率是具有一定的提升空间的。
技术实现思路
本专利技术要解决的技术问题,在于提供一种基于身份和非身份属性交互学习的行人属性识别方法,达到提升行人属性识别准确率的目的。r>本专利技术提出的方法:一种基于身份和非身份属性交互学习的行人属性识别方法,包括:首先,所述方法采用一种具有视角变化鲁棒性的特征学习方法对行人图像进行特征表达;其次,将行人属性分为身份属性和非身份属性,对二者之间的潜在关系进行建模,设计出行人身份属性和非身份属性交互学习的目标函数,通过目标函数进行优化,实现了行人的属性的识别。进一步地,所述一种具有对视角变化鲁棒性的行人特征学习方法为:首先,利用卷积神经网络提取输入的行人图像的特征映射(FeatureMap);其次,将得到的特征映射进行水平平均池化、垂直平均池化、对角平均池化和反对角平均池化;然后,对各个方向平均池化后的特征映射再各自进行空间归一化操作,得到四种方向的行人特征;最后,把四种方向的行人特征串联起来,作为最终的行人图像的特征表达,具有对视角变化的鲁棒性。进一步地,所述行人身份属性和非身份属性交互学习的目标函数,具体设计如下:L=G+αA+βB(1)其中,G是M个属性的Softmax总和;A为根据“相同身份的行人之间,必然具有相同的非身份属性”设计的交互函数项;B为“非身份属性差异大的行人之间,其身份属性差异一般较大”设计的交互函数项;α,β≥0为用户设置的常数,用于控制A和B的权重,M表示待识别行人属性个数,id表示其中的身份属性,nid表示其中的非身份属性。进一步地,所述“相同身份的行人之间,必然具有相同的非身份属性”设计的交互函数项A如下:其中,N是样本总数,i,j是样本下标序号;l是指示函数,当其括号中的条件成立时,输出1;反之,则输出0;d为欧式距离计算公式;分别是i,j样本的身份属性标签;是由G中各个非身份属性的Softmax函数预测的i,j样本的非身份属性结果。进一步地,所述“非身份属性差异大的行人之间,其身份属性差异一般较大”设计的交互函数项B如下:其中,分别是i,j,k样本的身份属性标签;为i,j,k样本的非身份属性标签;Fi,Fj,Fk为i,j,k样本的视角鲁棒性行人特征,即步骤4的样本行人特征;d为欧式距离计算公式;τ为三元指示函数,其定义如下:本专利技术具有如下优点:该方法具有对视角变化鲁棒性的特征学习能力以及身份属性和非身份属性交互学习的能力,从而利用身份属性的识别优势促进对非身份属性识别率的提高,并且利用非身份属性识别率的提高反过来进一步改进身份属性的识别效果,进而实现提升行人属性识别的准确率的目的。附图说明下面参照附图结合实施例对本专利技术作进一步的说明。图1为本专利技术中的基于身份和非身份属性交互学习的行人属性识别方法示意图。具体实施方式本专利技术基于身份和非身份属性交互学习的行人属性识别方法,包括:首先,所述方法采用一种具有视角变化鲁棒性的特征学习方法对行人图像进行特征表达;其次,将行人属性分为身份属性和非身份属性,对二者之间的潜在关系进行建模,设计出行人身份属性和非身份属性交互学习的目标函数,采用mini-batch随机梯度下降算法对目标函数进行优化,实现了行人的属性的识别。所述方法在行人图像的特征学习方面,采用了一种具有对视角变化鲁棒性的行人特征学习方法。首先,利用卷积神经网络提取输入的行人图像的特征映射(FeatureMap);其次,将得到的特征映射进行水平平均池化、垂直平均池化、对角平均池化和反对角平均池化;然后,对各个方向平均池化后的特征映射再各自进行空间归一化操作,得到四种方向的行人特征;最后,把四种方向的行人特征串联起来,作为最终的行人图像的特征表达。所述方法中的行人身份属性和非身份属性交互学习的目标函数,具体如下:L=G+αA+βB(1)其中,G是M个属性的Softmax总和;A为根据“相同身份的行人之间,必然具有相同的非身份属性”设计的交互函数项;B为“非身份属性差异大的行人之间,其身份属性差异一般较大”设计的交互函数项;α,β≥0为用户设置的常数,用于控制A和B的权重,M表示待识别行人属性个数,id表示其中的身份属性,nid表示其中的非身份属性。所述“相同身份的行人之间,必然具有相同的非身份属性”设计的交互函数项A如下:其中,N是样本总数,i,j是样本下标序号;l是指示函数,当其括号中的条件成立时,输出1;反之,则输出0;d为欧式距离计算公式;分别是i,j样本的身份属性标签;是由G中各个非身份属性的Softmax函数预测的i,j样本的非身份属性结果。所述“非身份属性差异大的行人之间,其身份属性差异一般较大”设计的交互函数项B如下:其中,分别是i,j,k样本的身份属性标签;为i,j,k样本的非身份属性标签;Fi,Fj,Fk为i,j,k样本的视角鲁棒性行人特征,即步骤4的样本行人特征;d为欧式距离计算公式;τ为三元指示函数,其定义如下:本专利技术一种具体实施方式:如图1所示,为了简化本专利技术的网络方法构图,图1中所采用的基本特征学习模块(BasicFeatureLearningModule,B-FLM)是采用卷积(Convolutional,Conv)神经网络,包括Conv1、Conv2、Conv3以及Conv4,实际中可以采用已经存在的任何一款深度网络结构,例如DenseNet,ResNet,GoogLeNet等。在图1中B-FLM包括四个最大池化(MaxPooling,MP)层,包括MP1、MP2、MP3本文档来自技高网...

【技术保护点】
1.一种基于身份和非身份属性交互学习的行人属性识别方法,其特征在于:首先,所述方法采用一种具有视角变化鲁棒性的特征学习方法对行人图像进行特征表达;其次,将行人属性分为身份属性和非身份属性,对二者之间的潜在关系进行建模,设计出行人身份属性和非身份属性交互学习的目标函数,通过目标函数进行优化,实现了行人的属性的识别。/n

【技术特征摘要】
1.一种基于身份和非身份属性交互学习的行人属性识别方法,其特征在于:首先,所述方法采用一种具有视角变化鲁棒性的特征学习方法对行人图像进行特征表达;其次,将行人属性分为身份属性和非身份属性,对二者之间的潜在关系进行建模,设计出行人身份属性和非身份属性交互学习的目标函数,通过目标函数进行优化,实现了行人的属性的识别。


2.根据权利要求1所述的一种基于身份和非身份属性交互学习的行人属性识别方法,其特征在于:所述一种具有对视角变化鲁棒性的行人特征学习方法为:首先,利用卷积神经网络提取输入的行人图像的特征映射(FeatureMap);其次,将得到的特征映射进行水平平均池化、垂直平均池化、对角平均池化和反对角平均池化;然后,对各个方向平均池化后的特征映射再各自进行空间归一化操作,得到四种方向的行人特征;最后,把四种方向的行人特征串联起来,作为最终的行人图像的特征表达,具有对视角变化的鲁棒性。


3.根据权利要求1所述的一种基于身份和非身份属性交互学习的行人属性识别方法,其特征在于:所述的行人身份属性和非身份属性交互学习的目标函数,具体设计如下:
L=G+αA+βB(1)
其中,G是M个属性的Softmax总和;A为根据“相同身份的行人之间,必然具有相同的非身...

【专利技术属性】
技术研发人员:朱建清林艳崔晓琳李冲曾焕强陈婧蔡灿辉杜永兆
申请(专利权)人:华侨大学厦门市公安局思明分局中国人民公安大学
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1