The present invention provides a pedestrian weight recognition method and system, which is based on the normalization of pedestrian attitude and the pooling of time in Pyramid, including the following steps: receiving video image sequence, completing spatial alignment of the video image sequence through spatial two-dimensional affine transformation, and extracting the video image sequence after two dimensional affine transformation. The global feature of multiple frames; using the time Pyramid pooling algorithm to fuse the global features of the multiple frames in the video sequence to obtain an equal length sequence level image feature. Compared with traditional methods, in multiple video based pedestrian re recognition datasets, the recognition accuracy of the present invention exceeds the most recent methods and has a lower algorithm complexity.
【技术实现步骤摘要】
一种行人重识别方法及系统
本专利技术涉及图像识别
,尤其是涉及一种基于行人姿态归一化与时间金字塔池化的行人重识别方法及系统。
技术介绍
近年来,随着人们对社会的公共安全越来越关注,视频监控系统大量普及。诸如机场、火车站、校园和办公大楼等公众场所,都亟需监控,为安防保驾护航。面对海量的监控视频数据,大量的人力需要投入到视频信息的监控与检索中去,这种方式的效率不仅低,还造成了额外资源浪费。如果能够利用计算机视觉分析技术,自动化监控及分析视频信息,必然可以极大地加快“平安城市”的建设。行人重识别是计算机视觉的研究中关键的任务。一般来说,给定关于行人的一张图片或者一段视频,行人重识别就是在没有重叠区域的摄像头拍摄到的图片或者视频中,将同一个人识别出来的过程。尽管相关的研究越来越受到重视,行人重识别的准确率也已经提高了不少,但仍有许多困难需要解决。由于待识别的行人图片与原图片拍摄于不同的相机,设备的差异会给成像条件带来误差;不同的场景下的环境不一致,采集的数据也会产生不同的偏差;且光照的改变会使得同一种颜色的表现不同;更重要的是,行人在摄像头下的姿态变化以及遮挡问题,都使得对同一个人的辨别难度相当大。近年来,由于深度学习的浪潮,卷积神经网络被广泛应用于行人重识别领域,通过深度网络提取图像特征,并且在相应的特征空间上使用深度学习或者传统方法进行距离度量,大大提高了行人重识别的准确率。这些工作的进展皆得益于深度卷积网络模型在特征提取上的能力,但在判别能力的探索上却局限于给定的特征空间,也因此限制了深度模型判别能力的提高。
技术实现思路
为解决以上问题,本专利技术提出了 ...
【技术保护点】
一种行人重识别方法,基于行人姿态归一化与时间金字塔池化,其特征在于,包括如下步骤:接收视频图像序列,通过空间二维仿射变换完成所述视频图像序列的空间对齐;提取经过二维仿射变换后所述视频图像序列内多个帧的全局特征;使用时间金字塔池化算法,融合所述视频图像序列中多个帧的全局特征,以获得等长的序列级别的图像特征。
【技术特征摘要】
1.一种行人重识别方法,基于行人姿态归一化与时间金字塔池化,其特征在于,包括如下步骤:接收视频图像序列,通过空间二维仿射变换完成所述视频图像序列的空间对齐;提取经过二维仿射变换后所述视频图像序列内多个帧的全局特征;使用时间金字塔池化算法,融合所述视频图像序列中多个帧的全局特征,以获得等长的序列级别的图像特征。2.根据权利要求1所述的行人重识别方法,其特征在于:所述空间二维仿射变换包括按照空间变换网络的结构学习6个仿射变换参数。3.根据权利要求2所述的行人重识别方法,其特征在于:所述空间变换网络包括三个组成部分:定位网络、参数化采样网格、可微分的图像采样器。4.根据权利要求1所述的行人重识别方法,其特征在于:采用卷积神经网络提取所述全局特征。5.根据权利要求1所述的行人重识别方法,其特征在于:所述视频图像序列的长度不等。6.一种行人重识别系统,基于行...
【专利技术属性】
技术研发人员:张史梁,田奇,高文,李佳宁,
申请(专利权)人:北京大学,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。