一种冗余数据数据字典压缩感知视频目标跟踪方法技术

技术编号:17656457 阅读:28 留言:0更新日期:2018-04-08 09:17
本发明专利技术提供一种冗余数据数据字典压缩感知视频目标跟踪方法,将视频监控中的目标描述为红外和可见光双通道多特征构成的冗余数据字典子空间下的线性表示,提高了信号逼近的灵活性,结合压缩感知的方法,对冗余数据字典子空间进行稀疏性采样,在考虑噪声的情况下,利用粒子滤波方法框架对刚性运动目标进行跟踪。能够在提升光照条件变化、环境遮蔽等复杂环境下视频跟踪的鲁棒性的同时,降低对存储、计算等资源的要求,增强安防监控的无人化程度,并以更廉价的方式部署安防视频监控。

【技术实现步骤摘要】
一种冗余数据数据字典压缩感知视频目标跟踪方法
本专利技术属于安全生产系统

技术介绍
信息技术的高速发展推动了城市由信息化向智慧化发展,截至目前,我国政府已颁布了多批智慧城市建设的试点,国内掀起了智慧城市规划、布局、建设的高潮,为避免建设初期涌现出来的大量同质化问题,当前智慧城市、智慧小镇的建设越来越偏向于体现地区文化产业特色,各种特色园区建设已成燎原之势;同时,在国家大力发展战略性新兴产业,全力加快转变经济发展方式、调整经济结构的背景下,聚集式发展产业成为各地政府的重要工作,在已建园区继续转型升级的同时,大量新建园区不断涌现。随着园区建设、运行不断铺开,如偷盗、践踏、人身侵害等园区治安事件越来越引起各方关注,对园区安防提出了越来越高的要求,安防手段逐步由人防向人防、物防、技防结合的整体防控体系倾斜,视频监控是其中的主要手段。然而,园区管理范围广阔,点位庞大,网络结构复杂,受环境、资金、技术、服务、标准等方面的制约,不同地域物理环境、人文环境不同,建立全面、有效、无盲区的视频安防监控系统对于各园区来说难易程度不同,对系统的经济性和实用性提出了更高的要求;出于减少劳动强度的考虑以及全程全时动态监视的需要,要求视频监控系统具备自动检测、跟踪嫌疑人员的能力,而在实际运行过程中,受环境遮蔽、光照条件等因素的影响,对视频目标的自动识别、跟踪的鲁棒性提出了严峻的考验,对于低成本部署、高鲁棒性、7x24小时不间断运行的自主视频监控跟踪方法的需求愈加强烈。现有技术中大多使用粒子滤波作为一种具有处理非线性函数和非高斯分布系统能力的强适应性方法,被广泛应用于视觉跟踪领域,随着稀疏化方法的蓬勃发展,大量研究开始使用压缩感知等稀疏理论改进粒子滤波计算量过大的问题,以取得鲁棒性与算法负载间的平衡。采用类Haar特征组成数据字典的方法将当前帧跟踪对象看成之前帧目标集合的稀疏表示,通过求解规范化l1最小平方问题获得各粒子相似度的度量,从而解算出跟踪目标的位置,多尺度压缩感知跟踪方法和基于压缩感知特征选择的实时检测跟踪框架则将压缩感知作为一种特征降维手段,使用目标图像的正负两类特征构造数据字典,这些方法基于目标图像或小波特征,未脱离数据字典为一紧致框架的限制,限制了图像特征的使用,在处理昼夜光照条件变化或者图像遮挡等问题时表现出一定的局限性。部分方法,如多模板时空关联的局部反联合稀疏表示目标跟踪方法,通过构造过完备数据字典的方式,加强了信号逼近的灵活性,但其在粒子的相似度解算过程中需多次重复求解含参数高斯函数的优化问题或压缩感知的重构问题,增加了额外的算法负担。在实际应用中,图像的颜色、纹理等特征已被广泛证明在许多场合下可以更好地体现目标图像的可区分特性,采用符合紧致框架的数据字典进行目标跟踪,限制了数据字典的扩展性,也限制了使用各种经典图像特征构成特征数据字典,影响到相应跟踪方法在复杂环境下的鲁棒性。过完备数据字典方法加强了信号逼近的灵活性,但是由于相似度比较过程中涉及大量信号重构解算,使得算法负载大为增加。
技术实现思路
本专利技术主要针对周边环境中存在光照变化、背景干扰和目标遮挡情况下动态目标的视频跟踪问题,提出了一种基于冗余数据字典的压缩感知视频目标跟踪方法,可降低对视频图像清晰度以及监控服务设备计算、存储能力的要求。为达到上述目的,本专利技术可采用如下技术方案:一种冗余数据数据字典压缩感知视频目标跟踪方法,包括以下步骤:(1)、提取视频目标特征;(2)、根据视频目标特征对数据字典初始化;(3)、根据数据字典对视频目标建模;(4)、冗余数据字典下的压缩感知观测;(5)、压缩感知跟踪;(6)、数据字典更新;(7)、输出结果。进一步的,步骤(1)中的目标特征包括目标可见光与红外图像的局部二值模式特征,红外图像的灰度直方图、可见光图像的hsv直方图、以及红外与可见光双通道图像的低阶不变矩和紧密性特征。进一步的,步骤(2)中的数据字典初始化方法为:以弹性矩形区域描述动态刚性目标,记第一帧目标矩形区域的中心点坐标为g1,与此对应,根据此矩形区域提取的图像特征按列堆叠形成的特征向量记为t(g1)=[p1(g1),p2(g1),…,pk(g1)]T,k=1,…m其中pk(g1)为第k个特征,m为所采用的特征的个数,随后,在目标中心g1的基础上加上一个[0,1]上正态分布的随机值以产生Nt-1个摄动中心gi,i=2,…,Nt-1,其中Nt是目标模板集中包含的特征向量的个数,以这些摄动中心为中心,提取相同大小矩形区域的特征值,与t(g1)一起组成初始目标模板集并引入单位矩阵I=[i1,i2,…im]∈Rm×m来跟踪干扰,与初始目标模板集组成矩阵T'=[T,I],对该矩阵进行奇异值分解得到初始数据字典D=[d1…dn]∈Rm×n(m>>n),d1…dn为字典的列向量,n为字典的行维,即字典中列向量的个数,Rm×m表示m×m的实数矩阵。进一步的,步骤(3)中,使跟踪目标y∈Rm,基于初始数据字典得到其中x1,x2,…xn为各分量的表示系数,x=[x1,x2,…xn]即目标y在字典D张成子空间下的系数表示,这些表示系数可分为xt和xe两个类别,(Nt维实数矩阵)称为目标系数向量,xe∈Rm为噪声系数向量。进一步的,步骤(4)中压缩感知观测的方法为,在数据字典D中,对一个索引集令DΛ表示从D中按索引Λ抽取相应列向量组成的m×|Λ|的子矩阵,Ω(DΛ)是由DΛ的列向量张成的子空间,PΛ为一个正交投影,定义支撑集以提取原信号x中的s列,使这s列最大化程度近似原信号,并记录构成此s列的索引值;通过定义一个势为s的集合SD(x,s)来近似这个支撑集,|SD(x,s)|=s且仅需满足其中ε1,ε2≥0为足够小的常数。进一步的,步骤(5)中的压缩感知跟踪的方法为,基于粒子滤波框架,取状态转移分布函数p(st|st-1)服从高斯分布,并以图像的仿射变换来描述连续两帧中目标的运动,目标的状态变量定义为st=(α1,α2,α3,α4,tx,ty),其中(α1,α2,α3,α4)是形变参数,(tx,ty)是2D平移参数,st表示当前帧的状态,st-1为前一帧的状态,粒子的相似度通过压缩感知观测值之间的范式距离来度量,对于视频的每一帧,基于冗余数据字典的压缩感知跟踪算法的流程包括以下步骤:基于可见光与红外帧图像,高斯随机观测矩阵Φ∈Rd×m,数据字典D(5.1)获得前一帧目标压缩感知观测值(5.2)根据状态传输方程产生粒子Ns为粒子的个数,本方法取Ns=300,表示第k帧中产生的第i个粒子;(5.3)对于每个粒子,按照下述方法计算相似度:1>根据粒子得到候选目标,提取候选目标的特征向量;2>以高斯随机矩阵采样获得各候选目标的压缩感知观测值zi=Θxi,Θ=ΦD为观测矩阵与字典的乘积矩阵;3>计算残差4>根据残差得到各粒子的观测相似度li=exp(-λri);(5.4)根据相似度li对粒子重采样;(5.5)采用均方差(MSE)方法估计当前帧状态(5.6)压缩采样对应区域的特征,得到(5.7)使用信号空间压缩感知基追踪算法重新解算获得跟踪结果(5.8)更新数据字典;(5.9)输出跟踪结果更新的状态更新后的数据字典D本文档来自技高网
...

【技术保护点】
一种冗余数据数据字典压缩感知视频目标跟踪方法,其特征在于:包括以下步骤:(1)、提取视频目标特征;(2)、根据视频目标特征对数据字典初始化;(3)、根据数据字典对视频目标建模;(4)、冗余数据字典下的压缩感知观测;(5)、压缩感知跟踪;(6)、数据字典更新;(7)、输出结果。

【技术特征摘要】
1.一种冗余数据数据字典压缩感知视频目标跟踪方法,其特征在于:包括以下步骤:(1)、提取视频目标特征;(2)、根据视频目标特征对数据字典初始化;(3)、根据数据字典对视频目标建模;(4)、冗余数据字典下的压缩感知观测;(5)、压缩感知跟踪;(6)、数据字典更新;(7)、输出结果。2.根据权利要求1所述的跟踪方法,其特征在于:步骤(1)中的目标特征包括目标可见光与红外图像的局部二值模式特征,红外图像的灰度直方图、可见光图像的hsv直方图、以及红外与可见光双通道图像的低阶不变矩和紧密性特征。3.根据权利要求2所述的跟踪方法,其特征在于:步骤(2)中的数据字典初始化方法为:以弹性矩形区域描述动态刚性目标,记第一帧目标矩形区域的中心点坐标为g1,与此对应,根据此矩形区域提取的图像特征按列堆叠形成的特征向量记为t(g1)=[p1(g1),p2(g1),…,pk(g1)]T,k=1,…m其中pk(g1)为第k个特征,m为所采用的特征的个数,随后,在目标中心g1的基础上加上一个[0,1]上正态分布的随机值以产生Nt-1个摄动中心gi,i=2,…,Nt-1,其中Nt是目标模板集中包含的特征向量的个数,以这些摄动中心为中心,提取相同大小矩形区域的特征值,与t(g1)一起组成初始目标模板集并引入单位矩阵I=[i1,i2,…im]∈Rm×m来跟踪干扰,与初始目标模板集组成矩阵T'=[T,I],对该矩阵进行奇异值分解得到初始数据字典D=[d1…dn]∈Rm×n(m>>n),d1…dn为字典的列向量,n为字典的行维,即字典中列向量的个数,Rm×m表示m×m的实数矩阵。4.根据权利要求3所述的跟踪方法,其特征在于:步骤(3)中,使跟踪目标y∈Rm,基于初始数据字典得到其中x1,x2,…xn为各分量的表示系数,x=[x1,x2,…xn]即目标y在字典D张成子空间下的系数表示,这些表示系数可分为xt和xe两个类别,(Nt维实数矩阵)称为目标系数向量,xe∈Rm为噪声系数向量。5.根据权利要求4所述的跟踪方法,其特征在于:步骤(4)中压缩感知观测的方法为,在数据字典D中,对一个索引集令DΛ表示从D中按索引Λ抽取相应列向量组成的m×|Λ|的子矩阵,Ω(DΛ)是由DΛ的列向量张成的子空间,PΛ为一个正交投影,定义支撑集以提取原信号x中的s列,使这s列最大化程度近似原信号,并记录构成此s列的索引值;通过定义一个势为s的集合SD(x,s)来近似这个支撑集,|SD(x,s)|=s且仅需满足

【专利技术属性】
技术研发人员:何亮
申请(专利权)人:南京莱斯信息技术股份有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1