The invention discloses a visual tracking method based on convolution sparse filtering, which includes the following steps: 1) using convolution sparse filtering method for off-line training, unsupervised feature learning on tracking video sequence to obtain a set of convolution kernels; 2) using convolution kernels to form convolution neural network for on-line tracking, so as to extract features from input images; 3) combining with kernelized phase; Close the filter tracking framework to achieve target tracking. The visual tracking method based on convolution sparse filtering is invented. This method is based on the principle of deep learning, and automatically learns the features of the target to be tracked. It can make use of the advantages of large data to obtain more stable and distinguishing features, and then achieve high precision and robustness tracking effect. The invention is based on convolution sparse filtering tracking method, and has the characteristics of high accuracy, fast speed and robust tracking effect.
【技术实现步骤摘要】
一种基于卷积稀疏滤波的视觉跟踪方法
本专利技术属于视觉跟踪
,尤其是一种基于卷积稀疏滤波的视觉跟踪方法。
技术介绍
视觉跟踪是计算机视觉研究领域中的热点,有着广泛的应用。而跟踪技术对运算速度的要求很高,无法达到实时即意味着难以实用。目前跟踪效果最好的方法均为基于深度学习的方法。其中效果最好的跟踪算法是韩国浦项工科大学的HyeonseobNam和BohyungHan提出的MDNet,该方法基于卷积神经网络(CNN)的多域学习框架,将域无关信息从特定域信息中分离出来,以获取有效的表示。首次实现了直接使用视频序列作为训练数据。此外,他们还将难样本挖掘技术整合进在线学习中,成为提升该算法性能的一个关键。但由于在跟踪过程中还需要利用跟踪时的数据对模型进行fine-tune训练,导致该算法速度很慢。在普通PC机上处理1帧就需要3~5秒,难以实用。另外,他们的目标位置预测是通过随机裁框,对这些框进行分类,最后再对分类出的框进行框回归(boundingboxregression)以得到精确的目标位置。该策略显然不是目标位置预测的最优策略,且同样运算速度较慢。因此,为将此类高 ...
【技术保护点】
1.一种基于卷积稀疏滤波的视觉跟踪方法,其特征在于,包括以下步骤:1)采用卷积稀疏滤波方法对目标特征提取矩阵进行离线训练,在跟踪视频序列上进行无监督特征学习,得到最优特征提取矩阵;2)在线跟踪过程中初始化跟踪器,用最优特征提取矩阵卷积得到初始模板特征和岭回归解;3)利用最优特征提取矩阵对测试图像提取特征得到的测试样本特征,利用核函数计算测试样本特征与初始模板特征的相关性,而后卷积岭回归解,得到预测目标位置,更新跟踪器,实现对目标的跟踪。
【技术特征摘要】
1.一种基于卷积稀疏滤波的视觉跟踪方法,其特征在于,包括以下步骤:1)采用卷积稀疏滤波方法对目标特征提取矩阵进行离线训练,在跟踪视频序列上进行无监督特征学习,得到最优特征提取矩阵;2)在线跟踪过程中初始化跟踪器,用最优特征提取矩阵卷积得到初始模板特征和岭回归解;3)利用最优特征提取矩阵对测试图像提取特征得到的测试样本特征,利用核函数计算测试样本特征与初始模板特征的相关性,而后卷积岭回归解,得到预测目标位置,更新跟踪器,实现对目标的跟踪。2.根据权利要求1所述的基于卷积稀疏滤波的视觉跟踪方法,其特征在于,步骤1)具体包括步骤:101)获取训练数据集;102)在多组图像序列中随机选择目标矩形内的多个子块图像,将每个子块图像排列成列向量形式作为目标训练样本,记作e={e1,e2,...en};103)用随机数初始化权值矩阵,得到初始化后的权值矩阵W={wi,j}∈Rm×n,随机数取值范围为0到样本数目之间的任意值,权值矩阵维度与目标训练样本维度相同;104)将初始化后权值矩阵W与目标训练样本e线性运算,得到G=W·e,其中G={gi};105)将激活函数h(g)对G逐元素运算,得到激活后的特征矩阵其中,激活函数h(g)为非线性函数;106)对激活后的特征矩阵F行规范化得到其中,||||1和||||2分别表示向量的1范数和2范数;107)对矩阵列规范化得到其中108)对矩阵先行后列求取梯度109)更新网络权重将更新后的W′替换步骤104)中的W;110)重复步骤104)~109),直至矩阵的1范数收敛,此时的W即为最优的特征提取矩阵。3.根据权利要求2所述的基于卷积稀疏滤波的视觉跟踪方法,其特征在于,步骤110)中的矩阵的1范数为当其取得最小值时得到的W为最优的特征提取矩阵。4.根据权利要求1所述的基于卷积稀疏滤波的视觉跟踪方法,其特征在于,步骤2)具体包括以下步骤:201)在输入的图像序列或视频中,获取初始帧图像信息IR(i,j),选择待跟踪的目标R0;202)创建跟踪器T,对跟踪器进行初始化,设置搜索范围tpad、学习率tLr、模块大小ttmsz、高斯带宽σ和正则项λ;203...
【专利技术属性】
技术研发人员:毕瑞星,马钟,
申请(专利权)人:西安微电子技术研究所,
类型:发明
国别省市:陕西,61
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。