一种基于距离正则化投影和字典学习的行人重识别算法制造技术

技术编号:20242832 阅读:45 留言:0更新日期:2019-01-29 23:29
本发明专利技术公开了一种基于距离正则化投影和字典学习的行人重识别算法,属于智能监控技术领域,本发明专利技术提出了一种新颖的字典学习框架以学习用于行人重识别中的判别和鲁棒性表示,判别字典和投影矩阵联合学习,通过学习投影矩阵,人物特征的编码系数被映射到低维子空间,从而有效地缓解非重叠视图中的行人差异。为了提高学习字典的判别能力,并且解决视觉模糊和外观变化的问题,引入顶端距离正则化在字典学习框架中以提炼出编码系数的解空间,提高了表示特征的能力,解决了度量学习中受到的限制问题,本发明专利技术引入了投影矩阵和顶端距离正则化项,在一定程度上缓解了非重叠视图中的行人差异,在行人重识别任务中取得较好的效果。

【技术实现步骤摘要】
一种基于距离正则化投影和字典学习的行人重识别算法
本专利技术涉及一种基于距离正则化投影和字典学习的行人重识别算法,属于智能监控

技术介绍
行人重识别,也称行人再识别,其任务是在不同物理位置分布的非重叠摄像机视图中匹配相同的行人。广泛被认为是一个图像检索的子问题。给定一个监控行人图像,检索跨设备下的该行人图像。旨在弥补目前固定的摄像头的视觉局限,并可与行人检测、行人跟踪技术相结合。近几年来,行人重识别日益受到关注并取得了一些重大的研究进展,被广泛应用于计算机视觉、安全监控、行人搜索以及刑事调查等领域。国内外学者在行人重识别方面取得了一系列重大研究进展,发展起了很多方法。按照学习的重点,这些方法主要有基于特征提取的行人重识别方法、基于度量学习的行人重识别方法等。其中,基于特征提取的方法主要专注于开发强大的特征表示以处理不相交视图之间的变化和错位,而基于度量的方法则着重于学习一个合适的相似性测量方法来最小化类内距离与此同时最大化类间距离。对于前者而言,尽管大量有效的视觉特征被提取,然而如何设计一个能够有效抵抗非重叠视图的变化和错位影响的描述符仍然十分困难。为了缓解由于视觉模糊和外本文档来自技高网...

【技术保护点】
1.一种基于距离正则化投影和字典学习的行人重识别算法,其特征在于,具体步骤如下:(1)从一个以上的摄像机中选取任意两个a,b摄像机,并从a,b摄像机的视频中分别选出同一行人的图像,且同一行人只选一张图像,设从a,b两个摄像机下分别选出M张行人图像,且a,b摄像机下选出的M张行人图像一一对应,然后从M张行人图像中抽取N张行人图像作为训练集,其余图像作为测试集,并分别提取选出的N张行人图像的特征向量,定义Xa=[xa1,xa2,…xaN],Xb=[xb1,xb2,…xbN]分别表示a,b两个摄像机下N张行人图像特征向量的集合,其中xa1,xa2,…xaN分别表示a摄像机下每张行人图像的特征向量,x...

【技术特征摘要】
1.一种基于距离正则化投影和字典学习的行人重识别算法,其特征在于,具体步骤如下:(1)从一个以上的摄像机中选取任意两个a,b摄像机,并从a,b摄像机的视频中分别选出同一行人的图像,且同一行人只选一张图像,设从a,b两个摄像机下分别选出M张行人图像,且a,b摄像机下选出的M张行人图像一一对应,然后从M张行人图像中抽取N张行人图像作为训练集,其余图像作为测试集,并分别提取选出的N张行人图像的特征向量,定义Xa=[xa1,xa2,…xaN],Xb=[xb1,xb2,…xbN]分别表示a,b两个摄像机下N张行人图像特征向量的集合,其中xa1,xa2,…xaN分别表示a摄像机下每张行人图像的特征向量,xb1,xb2,…xbN分别表示b摄像机下每张行人图像的特征向量,定义用于表示行人外观的、具有稀疏性的学习字典D,D∈Rp×m,D=[d1,d2,…dm],其中,p表示字典D的维度,m表示字典D的原子个数,d1,d2,…dm分别表示字典D的原子,di表示字典D的某个原子,且i=1,2,,,m,设字典D关于a,b两个摄像机视图下选出的行人图像的编码系数集合分别为Za,Zb,则Za=[za1,za2,…zaN],Zb=[zb1,zb2,…zbN],其中,za1,za2,…zaN分别表示a摄像机视图下选出的每张行人图像特征向量的编码系数,zb1,zb2,…zbN分别表示b摄像机视图下选出的每张行人图像特征向量的编码系数,建立如下最小化目标函数公式(1):其中,λ1是一个标量超参数,约束条件为即字典D的每个原子的l2范数的平方小于等于1,||·||F为F范数运算符,||·||2为l2范数运算符,||·||1为l1范数运算符,为F范数的平方运算符;(2)通过公式(2)对a,b两个摄像机视图下选出的行人图像的编码系数进行约束,使两个摄像机视图下选出的行人图像的编码系数相同:其中λ2为标量超参数;(3)引入投影学习将编码系数映射到一个低维空间,使不同摄像机视图下同一行人图像之间的距离最小化,令P∈Rm×q(q<m)表示映射矩阵,q表示映射矩阵P的维度,m为原子个数,则有如下公式(3):其中,tr(PTP)表示矩阵的迹,λ3为超参数;(4)对矩阵P提出判别正则化项,具体形式为如下公式(4):其中R(P)表示P的正则化项,L表示损失函数,即判别两个视图下行人图像是否为同一行人的误差,yij的取值为1或-1,若a摄像机视图下第i张行人图像与b摄像机视图下第j张行人图像为同一行人时,则yij的取值为1,若a摄像机视图下第i张行人图像与b摄像机视图下第j张行人图像不是同一行人时,则yij的取值为-1,z...

【专利技术属性】
技术研发人员:李华锋董能文永华竹晋廷线岩团王红斌
申请(专利权)人:昆明理工大学
类型:发明
国别省市:云南,53

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1