当前位置: 首页 > 专利查询>燕山大学专利>正文

一种增强的多层卷积视觉跟踪方法技术

技术编号:18166649 阅读:38 留言:0更新日期:2018-06-09 12:10
一种增强的多层卷积视觉跟踪方法,具体为:采用VGG‑19深层网络框架,采用0.5倍第三层与0.5倍第四层卷积层直接加和作为输出特征模板,并通过主成分分析对特征模板降维得到所需特征图,采用加和的卷积特征,增加所提取特征的鲁棒性;根据目标位置,确定颜色直方图比例权重,权重乘以上帧目标尺寸即为当前目标尺寸;根据滤波模板输出的最大响应值是否大于给定阈值,判定目标是否消失,若大于则直接确定目标位置,若小于则消失,通过间隔帧差法确定检测区域的待检测目标位置,以直方图权重排除非目标物体干扰,确定可疑目标物体,提取特征,与滤波模板做相关,找出大于阈值的最大响应,确定目标位置。本发明专利技术缓解了跟踪当中姿态、光照强度等因素导致目标外观变化以及遮挡等问题。

【技术实现步骤摘要】
一种增强的多层卷积视觉跟踪方法
本专利技术涉及机器视觉目标跟踪领域,尤其是涉及一种增强的多层卷积视觉跟踪方法。
技术介绍
机器视觉在最近几年越来越受关注,目标跟踪作为机器视觉的一个重要研究方向,在智能机器人、智能交通、人机交互等方面有广泛的应用。目前目标跟踪算法主要分为两种:产生式跟踪方法和判别式跟踪方法;产生式目标跟踪算法着重于对目标的本身的刻画,不断去搜索和目标最相似的区域,代表方法有模板匹配、粒子滤波、均值漂移算法等。判别式方法旨在将目标从背景中区分出来,就是将跟踪问题变为二分类问题,代表算法有相关滤波跟踪算法、多层卷积视觉跟踪算法。2010年相关滤波跟踪算法的提出,使得跟踪算法速度和性能上有了很大的提升;但是对跟踪当中的运动物体之间的部分遮挡、全遮挡或长时间遮挡,姿态、光照强度等因素导致目标外观的变化以及目标的快速变化导致的跟踪漂移等问题仍没有较好的解决办法。2006年,Hinton团队提出了深层网络训练中梯度消失问题的解决方案。2012年,Hinton团队为了证明深度学习的潜力,首次参加ImageNet图像识别比赛,其通过构建的卷积神经网络AlexNet一举夺得冠军,且碾压第二名(SVM方法)的分类性能。卷积神经网络也因此得到跟踪领域学者的广泛关注,与之相关的跟踪算法也是相继提出。卷积网络的出现很大缓解跟踪当中姿态、光照强度等因素导致目标外观变化的问题,但是同样速度慢对设备要求高也严重影响了卷积算法在跟踪领域的应用。卷积算法跟踪的速度也成为众多深度学者研究的重要方向。
技术实现思路
本专利技术目的在于提出一种增强的多层卷积视觉跟踪方法,在快速自适应相关滤波算法框架下通过多层卷积网络提取更加鲁棒的卷积特征加入尺度策略并引入帧差法与边缘提取来解决跟踪当中的遮挡和目标快速变化的问题。为实现上述目的,采用了以下技术方案:本专利技术所述跟踪方法包括以下步骤:步骤1,获取视频序列或图片序列,得到前一帧目标位置Pt-1和尺寸St-1;步骤2,特征提取模块,采用深层网络的浅层信息权重加和作为特征输出,并通过主成分分析对特征进行降维,得到所需特征图;步骤3,给定预期高斯输出,得到前一帧位置模型和;步骤4,目标定位模块,根据滤波模板输出的最大响应值是否大于给定阈值,判定目标是否消失,若大于则直接确定目标位置;若小于则消失,通过间隔帧差法确定检测区域的待检测目标位置,以直方图权重排除非目标物体干扰,确定可疑目标物体,提取特征,与滤波模板做相关,找出大于阈值的最大响应,确定目标位置;步骤5,尺度策略模块,根据目标位置,确定颜色直方图比例权重,权重乘以上帧目标尺寸即为当前目标尺寸;步骤6,更新位置模型和进一步的,步骤2中,特征提取模块,具体方法如下:步骤2-1,通过循环矩阵获取目标周围的候选区Z,使用训练好的VGG-19网络中的卷积层0.5倍第三层与0.5倍第四层加和输出作为特征提取层;步骤2-2,通过主成份分析实现特征降维,为减少在傅里叶域的计算量,更新目标模板:ut=(1-η)ut-1+ηft(1)ut为当前帧目标模板,ut-1为上一帧目标模板,ft为当前帧训练样本,η为更新目标模板学习率,ut通过压缩的映射矩阵Pt构造,Pt通过最小化模板的重构误差得到:ε为最小重构误差,PtT为映射矩阵P的转置矩阵,n为目标模板ut元素个数,此时,压缩特征的候选区记为其中zt为候选区,F为傅里叶变换。进一步的,步骤3中,给定预期高斯输出g,训练得到位置模型和具体方法如下:步骤3-1,通过最小化相关响应与预期相关输出g误差的二范数ε,获得位置相关滤波器h*记为循环相关,hl为当前特征通道的滤波模板,fl为当前特征通道的训练样本,λ为正则化参数,d为特征通道的个数,l∈{1,...,d}为特征通道,g为高斯函数;步骤3-2,引入傅里叶变换,训练得到位置滤波模板HlH、F、G为傅里叶变换下的滤波模板h,训练样本f以及预期高斯输出g,横杠记为G的共轭转置。步骤3-3,得到位置模型和其中压缩的训练样本压缩的目标模板进一步的,在步骤4中,目标定位模块,方法如下:步骤4-1,响应值Y计算公式如下:步骤4-2,判断输出响应是否大于给定阈值,若大于阈值,则根据最大相应位置更新目标位置;步骤4-3,若小于阈值认为目标丢失,则保留前一帧目标模板,提取当前目标为中心2倍候选区域为检测区域,每相隔三帧对检测区域做一次帧差,确定检测区域的待检测目标物体,通过轮廓提取获得待检测目标物体的最小外接矩形;步骤4-4,通过计算待检测目标物体的颜色直方图与目标区域的颜色直方图比率,确定待检测目标物体可信度,排除可信度较小的待检测目标物体,确定疑似目标物体;步骤4-5,提取疑似目标物体特征,置为保存的滤波模板大小;步骤4-6,对疑似目标物体与滤波模板进行相关操作,并重复上述步骤直至出现大于阈值的目标出现,以该位置为目标位置,启用相关滤波算法。进一步的,步骤5的具体内容如下:步骤5-1,若最大响应大于给定阈值,确定目标位置,提取目标范围颜色直方图,并以当前帧目标颜色直方图占上一帧颜色直方图比例,确定颜色直方图权重,以该权重乘以上一帧目标尺寸为当前目标尺寸;步骤5-2,若最大响应值小于给定阈值,则采用以间隔帧差法最后跟踪所确定的目标尺寸记为当前目标尺寸St。进一步的,步骤6中,更新位置模型和如下:与现有技术相比,本专利技术方法具有如下优点:1、在算法框架上选择了主流的相关滤波算法框架,同时兼顾尺度估计策略。2、在特征提取上选择了深度卷积网络的浅层特征,提取更具鲁棒性的第三层与第四层加和作为输出特征,保存更加完整特征细节,很大程度上缓解了目标受环境引入而引起的外观变化,同时引入主成份分析实现特征降维来实现算法的提速。3、采用间隔帧差法,解决目标跟踪当中遇到的遮挡问题。附图说明图1为本专利技术方法的总体流程示意图;图2为特征提取模块流程图;图3为目标定位模块流程图;图4为尺度策略模块流程图;图5为运行结果示意图。具体实施方式下面结合附图对本专利技术做进一步说明:如图1所示,本专利技术所述方法包括以下步骤:步骤1,获取视频序列或图片序列,得到前一帧目标位置Pt-1和尺寸St-1;步骤2,特征提取模块,采用深层网络的浅层信息权重加和作为特征输出,并通过主成分分析对特征进行降维,得到所需特征图;如图2所示,特征提取模块具体方法如下:步骤2-1,通过循环矩阵获取目标周围的候选区Z,使用训练好的VGG-19网络中的卷积层0.5倍第三层与0.5倍第四层加和输出作为特征提取层;步骤2-2,通过主成份分析实现特征降维,为减少在傅里叶域的计算量,更新目标模板:ut=(1-η)ut-1+ηft(1)ut为当前帧目标模板,ut-1为上一帧目标模板,ft为当前帧训练样本,η为更新目标模板学习率,ut通过压缩的映射矩阵Pt构造,Pt通过最小化模板的重构误差得到:ε为最小重构误差,PtT为映射矩阵P的转置矩阵,n为目标模板ut元素个数,此时,压缩特征的候选区记为其中zt为候选区,为傅里叶变换。步骤3,给定预期高斯输出,得到前一帧位置模型和步骤3-1,通过最小化相关响应与预期相关输出g误差的二范数ε,获得位置相关滤波器h*记为循环相关,hl为当前特征通道的滤波模板,fl为当前特征通道的训练样本,λ为正则化参数,d为特征通本文档来自技高网...
一种增强的多层卷积视觉跟踪方法

【技术保护点】
一种增强的多层卷积视觉跟踪方法,其特征在于:所述跟踪方法包括以下步骤:步骤1,获取视频序列或图片序列,得到前一帧目标位置Pt‑1和尺寸St‑1;步骤2,特征提取模块,采用深层网络的浅层信息权重加和作为特征输出,并通过主成分分析对特征进行降维,得到所需特征图;步骤3,给定预期高斯输出,得到前一帧位置模型

【技术特征摘要】
1.一种增强的多层卷积视觉跟踪方法,其特征在于:所述跟踪方法包括以下步骤:步骤1,获取视频序列或图片序列,得到前一帧目标位置Pt-1和尺寸St-1;步骤2,特征提取模块,采用深层网络的浅层信息权重加和作为特征输出,并通过主成分分析对特征进行降维,得到所需特征图;步骤3,给定预期高斯输出,得到前一帧位置模型和步骤4,目标定位模块,根据滤波模板输出的最大响应值是否大于给定阈值,判定目标是否消失,若大于则直接确定目标位置;若小于则消失,通过间隔帧差法确定检测区域的待检测目标位置,以直方图权重排除非目标物体干扰,确定可疑目标物体,提取特征,与滤波模板做相关,找出大于阈值的最大响应,确定目标位置;步骤5,尺度策略模块,根据目标位置,确定颜色直方图比例权重,权重乘以上帧目标尺寸即为当前目标尺寸;步骤6,更新位置模型和2.根据权利要求1所述的一种增强的多层卷积视觉跟踪方法,其特征在于,步骤2中,特征提取模块,具体方法如下:步骤2-1,通过循环矩阵获取目标周围的候选区Z,使用训练好的VGG-19网络中的卷积层0.5倍第三层与0.5倍第四层加和输出作为特征提取层;步骤2-2,通过主成份分析实现特征降维,为减少在傅里叶域的计算量,更新目标模板:ut=(1-η)ut-1+ηft(1)ut为当前帧目标模板,ut-1为上一帧目标模板,ft为当前帧训练样本,η为更新目标模板学习率,ut通过压缩的映射矩阵Pt构造,Pt通过最小化模板的重构误差得到:ε为最小重构误差,为映射矩...

【专利技术属性】
技术研发人员:胡硕韩江龙赵银妹孙翔王凯
申请(专利权)人:燕山大学
类型:发明
国别省市:河北,13

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1