【技术实现步骤摘要】
基于长短记忆型递归神经网络的行人属性预测方法
本专利技术属于智能监控领域,具体讲,涉及基于长短记忆型递归神经网络的行人属性预测方法。
技术介绍
近年来,随着城市中监控摄像头的大量普及,城市安全得到了进一步的保障。监控人员利用监控视频能够查找人员,还原事件,直观的了解事件的始末。但是随着监控视频数量的海量增长,人们往往需要大量的时间和精力才能在监控视频中搜索到符合特征要求的行人。如何准确的对行人属性进行自动化描述,从而使人们能够快速的得到行人的有用信息,变得十分重要。采用计算机视觉技术对行人图像进行分析处理是解决这一问题的主流方法。其目的是使得监控视频的处理更加智能化,自动化。针对监控视频下的行人属性预测,许多学者和研究机构提出了相应的数据集与预测方法。其中PETA(行人属性数据库)数据集是现阶段较为大型的行人图像及属性数据集,其提供了19000张不同场景下的行人图像及其精细化属性标签(如性别,头发长度,衣服颜色),为训练高效的行人属性预测模型提供可能。对于行人属性预测,大致可分为两种方法。第一种利用传统特征构造各属性分类器的方法,该方法独立看待行人图像的各属性标签 ...
【技术保护点】
一种基于长短记忆型递归神经网络的行人属性预测方法,其特征是,首先进行图像视觉信息的提取,输入行人图像,输出行人图像的视觉特征向量;然后进行序列化属性标签的表示和标签语义信息的提取;随后统计训练数据中出现的属性词,构造相应大小的属性标签词典;利用查找表构建语义嵌入层,完成文本语义向量的提取;最后构建多模态长短记忆型递归神经网络LSTM模型,设计符合要求的损失函数。
【技术特征摘要】
1.一种基于长短记忆型递归神经网络的行人属性预测方法,其特征是,首先进行图像视觉信息的提取,输入行人图像,输出行人图像的视觉特征向量;然后进行序列化属性标签的表示和标签语义信息的提取;随后统计训练数据中出现的属性词,构造相应大小的属性标签词典;利用查找表构建语义嵌入层,完成文本语义向量的提取;最后构建多模态长短记忆型递归神经网络LSTM模型,设计符合要求的损失函数。2.如权利要求1所述的基于长短记忆型递归神经网络的行人属性预测方法,其特征是,输入行人图像,提取行人图像的视觉特征向量,具体是,将行人图像数据送入预训练好的深度特征提取模型,得到H维的特征向量,之后构建一层神经网络将H维的特征向量变换为M维的特征向量,从而完成视觉信息的提取。3.如权利要求1所述的基于长短记忆型递归神经网络的行人属性预测方法,其特征是,构建属性标签词典的具体步骤是,词典的大小为N+2,其中N代表属性类别的个数,+2表示多模态LSTM中增加的开始标志和结束标志,词典中每个属性标签,包括开始和结束标志,被表示为独热one-hot向量的形式,即每个属性所对应的标志位为1,其余全为0。4.如权利要求1所述的基于长短记忆型递归神经网络的行人属...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。