当前位置: 首页 > 专利查询>武汉大学专利>正文

一种基于压缩域融合的Mean shift核窗宽动态更新方法技术

技术编号:9434996 阅读:100 留言:0更新日期:2013-12-12 00:56
本发明专利技术公开了一种基于压缩域融合的Meanshift核窗宽动态更新方法,该方法将压缩域分析与Meanshift跟踪算法相结合,即首先对视频编码过程中产生的运动矢量进行概率统计分析,以获取目标运动的尺寸大小,据此动态更新目标的颜色概率模型及核窗宽大小,使得目标模型更加真实。本发明专利技术的技术方案不仅提高了目标尺寸明显变化下的运动跟踪精度,而且提高了运算效率。该方案尤其适用于智能视频监控设备中的视频编码与目标跟踪同时进行的情况。

【技术实现步骤摘要】
【专利摘要】本专利技术公开了一种基于压缩域融合的Meanshift核窗宽动态更新方法,该方法将压缩域分析与Meanshift跟踪算法相结合,即首先对视频编码过程中产生的运动矢量进行概率统计分析,以获取目标运动的尺寸大小,据此动态更新目标的颜色概率模型及核窗宽大小,使得目标模型更加真实。本专利技术的技术方案不仅提高了目标尺寸明显变化下的运动跟踪精度,而且提高了运算效率。该方案尤其适用于智能视频监控设备中的视频编码与目标跟踪同时进行的情况。【专利说明】—种基于压缩域融合的Mean shift核窗宽动态更新方法
本专利技术属于视频智能分析
,特别涉及。
技术介绍
Mean shift算法(均值偏移算法)是一种非参数密度估计算法,由Fukunaga于1975年首先提出。其作为一种高效的模式匹配算法,己被成功地应用于实时性要求较高的目标跟踪系统中。Dorm Comaniciu首先将Mean Shift算法应用于图像滤波、分割与目标跟踪等领域。Bradski提出以颜色直方图为目标模式的Mean shift目标跟踪算法。该算法先利用颜色直方图得到每帧图像的颜色投影图,然后自适应调整搜索窗口的位置和大小,并通过不断收敛将得到的最优中心位置作为目标的中心。相比较其他的运动目标跟踪算法,Mean shift算法具有如下特点:(I)计算量不大,可以满足实时跟踪的要求;(2)对运动目标变形、旋转,背景变化不敏感;(3)对于部分遮挡情况下的目标跟踪具有一定的鲁棒性;(4)Mean shift作为一个无参数密度估计算法,容易与其他算法进行融合与集成。但是,Mean shift算法也存在一些缺陷:(I)跟踪过程中核窗宽的大小保持不变,当目标有明显尺度变化时,可能导致跟踪失败;(2)颜色直方图是一种比较弱的对目标特征的描述,当有相似颜色干扰(遮挡)时,算法效果欠佳;(3)Mean shift算法进行局部搜索,当场景中目标的运动速度很快时,目标区域在相邻两帧间会出现没有重叠的区域的情况,目标此时往往收敛于背景中与目标颜色分布比较相似的物体,而不是场景中的目标,从而跟踪丢失;另外,Mean shift算法跟踪效果的提升主要依赖于单一颜色特征描述被跟踪目标的准确性,如果继续延续这一思路,基于颜色特征的Mean shift目标跟踪效果很难有更大的提升空间。
技术实现思路
本专利技术针对Mean shift算法跟踪尺度变化的目标易丢失的问题,提出了基于压缩域融合的Mean shift核窗宽动态更新方法,通过压缩域运动矢量的分析,提取运动目标的尺寸大小,据此动态更新目标的颜色概率模型及核窗宽大小,使得目标模型更加真实,从而提闻目标跟踪的准确性。本专利技术所采用的技术方案是:,其特征在于,包括以下步骤:步骤1:在首帧图像中采用人机交互方式手动获取待跟踪目标的区域信息,通过在首帧图像上采用矩形框直接标注待跟踪目标的区域,矩形框中心作为待跟踪目标的中心位置,其中心坐标为(X,y),矩形框宽度和长度为(Wtl, Htl),在此基础上建立待跟踪目标颜色概率的目标模型I;步骤2:从第二帧图像开始,在压缩域中根据运动矢量分析提取所述的待跟踪目标在当前帧中的尺寸(W,H);步骤3:待跟踪目标在当前帧中的尺寸(W,H)与待跟踪目标的尺寸(Wtl, H0)进行比较,判断待跟踪目标的尺寸变化比率是否超过预设阀值K?若是,则更新待跟踪目标的核窗宽大小,得到新的跟踪目标核窗宽,然后计算所述的新的跟踪目标核窗宽的颜色概率密度;若否,则计算所述的待跟踪目标核窗宽的颜色概率密度;步骤5:计算当前候选区域的颜色概率密度;其中所述的候选区域为所述的跟踪目标核窗宽所在帧的以后的每帧中,可能包含跟踪目标的区域;步骤6:计算所述的候选区域与跟踪目标核窗宽的相似性系数;步骤7:计算Mean Shift向量定位所述的跟踪目标核窗宽中心位置;步骤8:判断:所述的跟踪目标核窗宽的颜色概率密度是否收敛?如果否,则搜索当前候选区域的后一帧,回转执行所述的步骤5,计算后一帧的候选区域的颜色概率密度;如果是,则完成搜索,定位所述的跟踪目标核窗宽的中心位置。作为优选,步骤2所述的从第二帧图像开始,在压缩域中根据运动矢量分析提取所述的待跟踪目标在当前帧中的尺寸(W,H),其具体实现包括以下子步骤:步骤2.1:对压缩域的运动矢量进行预处理,即直接在编码过程中获取压缩域的运动矢量,并对所述的运动矢量进行噪声滤波处理;步骤2.2:对预处理后所得的运动矢量进行稠密化处理,将缺失的运动矢量补上;步骤2.3:用区域生长的方法解决所述的待跟踪目标在当前帧中的目标中心出现的中空现象;步骤2.4:得到能够很好地反映所述的待跟踪目标在当前帧中的目标运动状况的运动矢量场,通过标定相应的宏块来检测出运动区域,通过计算待跟踪目标在当前帧中的目标的外接矩形来提取出所述的待跟踪目标在当前帧中的尺寸大小。作为优选,步骤3所述的待跟踪目标在当前帧中的尺寸(W,H)与待跟踪目标的尺寸(WcHtl)进行比较,判断待跟踪目标的尺寸变化比率是否超过预设阀值K ?其判断标准为:如果(W,H)与(WcHtl)的差别大于预设阀值K,则计算待跟踪目标在当前帧中的尺寸与待跟踪目标的尺寸大小的比较值Dsize:【权利要求】1.,其特征在于,包括以下步骤: 步骤1:在首帧图像中采用人机交互方式手动获取待跟踪目标的区域信息,通过在首帧图像上采用矩形框直接标注待跟踪目标的区域,矩形框中心作为待跟踪目标的中心位置,其中心坐标为(X,y),矩形框宽度和长度为(Wtl, Htl),在此基础上建立待跟踪目标颜色概率的目标模型仏 步骤2:从第二帧图像开始,在压缩域中根据运动矢量分析提取所述的待跟踪目标在当前帧中的尺寸(W,H); 步骤3:待跟踪目标在当前巾贞中的尺寸(W,H)与待跟踪目标的尺寸(Wc Hci)进行比较,判断待跟踪目标的尺寸变化比率是否超过预设阀值K ? 若是,则更新待跟踪目标的核窗宽大小,得到新的跟踪目标核窗宽,然后计算所述的新的跟踪目标核窗宽的颜色概率密度; 若否,则计算所述的待跟踪目标核窗宽的颜色概率密度; 步骤5:计算当前候选区域的颜色概率密度;其中所述的候选区域为所述的跟踪目标核窗宽所在帧的以后的每帧中,可能包含跟踪目标的区域; 步骤6:计算所述的候选区域与跟踪目标核窗宽的相似性系数; 步骤7:计算Mean Shift向量定位所述的跟踪目标核窗宽中心位置; 步骤8:判断:所述的跟踪目标核窗宽的颜色概率密度是否收敛? 如果否,则搜索当前候选区域的后一帧,回转执行所述的步骤5,计算后一帧的候选区域的颜色概率密度; 如果是,则完成搜索,定位所述的跟踪目标核窗宽的中心位置。2.根据权利要求1所述的基于压缩域融合的Meanshift核窗宽动态更新方法,其特征在于:步骤2所述的从第二帧图像开始,在压缩域中根据运动矢量分析提取所述的待跟踪目标在当前帧中的尺寸(W,H),其具体实现包括以下子步骤: 步骤2.1:对压缩域的运动矢量进行预处理,即直接在编码过程中获取压缩域的运动矢量,并对所述的运动矢量进行噪声滤波处理; 步骤2.2:对预处理后所得的运动矢量进行稠密化处理,将缺失的运动矢量补上; 步骤2.3:用区域生长的方法解决所述本文档来自技高网
...

【技术保护点】
一种基于压缩域融合的Mean?shift核窗宽动态更新方法,其特征在于,包括以下步骤:步骤1:在首帧图像中采用人机交互方式手动获取待跟踪目标的区域信息,通过在首帧图像上采用矩形框直接标注待跟踪目标的区域,矩形框中心作为待跟踪目标的中心位置,其中心坐标为(x,y),矩形框宽度和长度为(W0,H0),在此基础上建立待跟踪目标颜色概率的目标模型步骤2:从第二帧图像开始,在压缩域中根据运动矢量分析提取所述的待跟踪目标在当前帧中的尺寸(W,H);步骤3:待跟踪目标在当前帧中的尺寸(W,H)与待跟踪目标的尺寸(W0,H0)进行比较,判断待跟踪目标的尺寸变化比率是否超过预设阀值K?若是,则更新待跟踪目标的核窗宽大小,得到新的跟踪目标核窗宽,然后计算所述的新的跟踪目标核窗宽的颜色概率密度;若否,则计算所述的待跟踪目标核窗宽的颜色概率密度;步骤5:计算当前候选区域的颜色概率密度;其中所述的候选区域为所述的跟踪目标核窗宽所在帧的以后的每帧中,可能包含跟踪目标的区域;步骤6:计算所述的候选区域与跟踪目标核窗宽的相似性系数;步骤7:计算Mean?Shift向量定位所述的跟踪目标核窗宽中心位置;步骤8:判断:所述的跟踪目标核窗宽的颜色概率密度是否收敛?如果否,则搜索当前候选区域的后一帧,回转执行所述的步骤5,计算后一帧的候选区域的颜色概率密度;如果是,则完成搜索,定位所述的跟踪目标核窗宽的中心位置。FDA00003800990700011.jpg...

【技术特征摘要】

【专利技术属性】
技术研发人员:田纲李明刘欢欢于欢何豫航
申请(专利权)人:武汉大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1