A method of pedestrian attribute recognition based on multitemporal attention model includes: acquiring image feature and attribute feature; constructing text supervision feature, which combines the two results of image feature and attribute feature, and cascading attribute feature as attribute supervision; constructing multitemporal attention mechanism, which uses the hidden layer vector of two moments to construct attention mechanism Secondly, the paper optimizes the weight of the image features together; takes the text supervision feature and context vector as the extra input of the long-term memory model, obtains the hidden layer vector containing the pedestrian attribute information; obtains the pedestrian attribute recognition probability; optimizes the pedestrian attribute recognition probability. The invention can quickly and effectively identify the attributes of different pedestrians in the real monitoring scene, has an important role in promoting other deep learning fields, such as pedestrian retrieval and pedestrian recognition, and has many positive roles in building a safe city and improving the urban monitoring system.
【技术实现步骤摘要】
基于多时态注意力模型的行人属性识别方法
本专利技术涉及一种行人属性识别方法。特别是涉及一种基于多时态注意力模型的行人属性识别方法。
技术介绍
现代城市中,每时每刻都有数以百万计的监控摄像头收集着行人和交通等视频和图片信息,为了保障人民的生命财产和城市安全,需要对这些海量数据进行实时的分析,早期的监控系统需要人工筛选数据,耗费大量的人力物力。随着机器学习的发展,尤其是深度学习的兴起,愈发方便处理海量数据。行人属性识别任务旨在给定一张含有行人的图像时,能够预测中行人所具有的属性,比如性别、年龄、衣服类型等,对于监控领域处理海量行人图像和行人重识别等任务有重要的作用。在监控领域中,行人属性识别任务能够从监控视频得到的图像中甄别可能对人民生命财产造成威胁的人或物品。此外行人属性识别任务对建成智慧城市有重要的促进作用,因此行人属性识别有着非常重要的研究价值和现实意义。早期的行人属性识别任务利用人工提取的特征,并利用SVM分类器进行分类,该方法需要耗费相当高的人力物力,而且行人属性识别的性能也不能满足人们的要求,随着深度学习的兴起,利用卷积神经网络进行特征提取和循环神经网络进行属性识别,极大地促进了识别性能的提高。此外研究人员还提出了一种能够优化图像特征权重分配的注意力机制,能够让模型更多的关注与属性相关的图像特征,从而有效提升了属性识别的性能。但是,目前利用LSTM进行属性识别的方法中,往往只在初始状态时输入一次图像,之后每个时刻都只输入属性信息,这样避免了多次利用图像的噪声造成模型过拟合的问题。然而,这种方式 ...
【技术保护点】
1.一种基于多时态注意力模型的行人属性识别方法,其特征在于,包括如下步骤:/n1)获取图像特征和属性特征;/n2)构造文本监督特征,是将图像特征和属性特征的两种组合结果进行融合,并级联属性特征作为属性监督;/n3)构造多时态注意力机制,是利用两个时刻的隐藏层向量构造注意力机制的对齐模型,然后共同对图像特征进行权重优化;/n4)将文本监督特征和上下文向量作为长短期记忆模型的额外输入,获得含有行人属性信息的隐藏层向量;/n5)获取行人属性识别概率p
【技术特征摘要】
1.一种基于多时态注意力模型的行人属性识别方法,其特征在于,包括如下步骤:
1)获取图像特征和属性特征;
2)构造文本监督特征,是将图像特征和属性特征的两种组合结果进行融合,并级联属性特征作为属性监督;
3)构造多时态注意力机制,是利用两个时刻的隐藏层向量构造注意力机制的对齐模型,然后共同对图像特征进行权重优化;
4)将文本监督特征和上下文向量作为长短期记忆模型的额外输入,获得含有行人属性信息的隐藏层向量;
5)获取行人属性识别概率pt=softmax(ht-1);
6)对行人属性识别概率pt进行优化。
2.根据权利要求1所述的基于多时态注意力模型的行人属性识别方法,其特征在于,步骤1)中所述的获取图像特征,是将图像输入到卷积神经网络中获取图像特征V={v1,…vi,…vN}。
3.根据权利要求1所述的基于多时态注意力模型的行人属性识别方法,其特征在于,步骤1)中所述的获取属性特征,是使用One-Hot的向量yt来表示属性特征,设定行人属性的特征有L个,即图像的属性特征Y=[y1,y2,…,yt,…,yL]。
4.根据权利要求1所述的基于多时态注意力模型的行人属性识别方法,其特征在于,步骤2)中所述的将图像特征和属性特征的两种组合结果进行特征融合,是采用如下公式:
mt=Φ(V⊙W1yt)+Ψ(V⊙W2yt)(1)
式中,mt为图像和文本的融合特征,Φ和Ψ分别为线性整流函数和双曲正切函数,V为图像特征,为了利用属性信息,引入两个不同属性嵌入矩阵W1和W2与属性特征向量yt构成两个不同的词向量,t表示时刻。
5.根据权利要求1所述的基于多时态注意力模型的行人属性识别方法,其特征在于,步骤2)中所述的级联属性特征作为属性监督,是利用属性嵌入矩阵W3构造一个词向量W3yt,然后将词向量W3yt与融合特征mt级联...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。