【技术实现步骤摘要】
长期目标跟踪方法
本专利技术涉及计算机视觉
,尤其涉及一种长期目标跟踪方法。
技术介绍
随着计算机视觉的日益发展,视觉跟踪已经广泛应用于许多计算机视觉任务,例如视频监控,视频检索和无人车感知系统。给出初始帧待跟踪目标的位置,跟踪器就可以在整个视频序列中一直跟踪该目标。虽然视觉跟踪方法取得了很大进展,但仍存在许多挑战,例如变形,遮挡,视野外,尺度变化,平面内旋转等。近年来,基于相关滤波(KCF)的方法(J.F.Henriques,R.Caseiro,P.Martins,andJ.Batista,"High-speedtrackingwithkernelizedcorrelationfilters,"IEEETransactionsonPatternAnalysisandMachineIntelligence,vol.37,no.3,pp.583-596,2015),由于其具备高计算效率和出色的跟踪性能,在跟踪领域最受欢迎。文章[1](J.F.Henriques,R.Caseiro,P.Martins,andJ.Batista,"High-speedtrackingwithkernelizedcorrelationfilters,"IEEETransactionsonPatternAnalysisandMachineIntelligence,vol.37,no.3,pp.583-596,2015)提出传统的KCF跟踪算法流程,利用到流行的tracking–by-detection(Z.Kalal,K ...
【技术保护点】
1.一种长期目标跟踪方法,其特征在于,包括:/n对于一段跟踪的视频序列,根据前一帧更新后的相关滤波器,预测当前帧中跟踪目标位置,根据与预测到的当前帧中跟踪目标位置相关的响应值指标,来判断预测到的当前帧中跟踪目标位置是否可靠;/n若可靠,则将预测到的当前帧中跟踪目标位置作为当前帧的跟踪结果,并更新当前帧的相关滤波器;/n若不可靠,则启动再检测模块,根据给定的前一帧中跟踪目标位置和大小生成一个疑似跟踪目标的候选者,并根据与疑似跟踪目标的候选者相关的响应值指标来判断是否满足替换条件;若是,则将疑似跟踪目标的候选者作为当前帧的跟踪结果,否则,继续保留预测到的当前帧中跟踪目标位置为当前帧的跟踪结果。/n
【技术特征摘要】
1.一种长期目标跟踪方法,其特征在于,包括:
对于一段跟踪的视频序列,根据前一帧更新后的相关滤波器,预测当前帧中跟踪目标位置,根据与预测到的当前帧中跟踪目标位置相关的响应值指标,来判断预测到的当前帧中跟踪目标位置是否可靠;
若可靠,则将预测到的当前帧中跟踪目标位置作为当前帧的跟踪结果,并更新当前帧的相关滤波器;
若不可靠,则启动再检测模块,根据给定的前一帧中跟踪目标位置和大小生成一个疑似跟踪目标的候选者,并根据与疑似跟踪目标的候选者相关的响应值指标来判断是否满足替换条件;若是,则将疑似跟踪目标的候选者作为当前帧的跟踪结果,否则,继续保留预测到的当前帧中跟踪目标位置为当前帧的跟踪结果。
2.根据权利要求1所述的一种长期目标跟踪方法,其特征在于,更新前一帧的相关滤波器的方式包括:
根据给定的前一帧中跟踪目标位置和大小,确定搜索区域,并提取搜索区域的特征x;
记y是符合高斯分布的特征标签,训练相关滤波器ft,优化函数如下所示:
ε(ft)=||ft*x-y||2+λ||ft||2
其中,*表示相关运算,λ为优化函数的正则项系数;
当ε(ft)最小时,训练出第t帧的相关滤波器ft,第t帧的相关滤波器更新公式为:
其中,为第1帧到第t-1帧的相关滤波器;为更新后的为第1帧到第t帧的相关滤波器,η为固定的更新率。
3.根据权利要求1所述的一种长期目标跟踪方法,其特征在于,预测当前帧中跟踪目标位置的步骤包括:
当前帧也即第t+1帧,以第t帧的目标位置与中心裁剪出一定范围的区域作为搜索区域,并提取出相应的特征图zt+1,然后,根据前一帧的更新后的相关滤波器得到第t+1帧的跟踪目标响应图St+1:
其中,和表示对和zt+1进行傅里叶变换的结果,F-1代表逆傅里叶变换,⊙表示矩阵点乘;
通过第t+1帧的跟踪目标响应图St+1,确定第t+1帧中跟踪目标位置。
4.根据权利要求3所述的一种长期目标跟踪方法,其特征在于,与预测到的当前帧中跟踪目标位置相关的响应值指标包括:HOGR响应值与COLOR响应值;其中,
HOGR响应值的计算公式为:
其中,Smax代表St+1中的最大值,μt代表St+1的均值,σt为St+1的标准差;
COLOR响应值的计算公式为:
其中,u表示特征图zt+1中的任意一个像素,T表示前一帧的颜色直方图的权重图,T(u)表示像素u的权重,得到的和特征图zt+1大小一样,代表了特征图zt+1中的一个像素u属于目标区域的概率;B(u)是以像素u为中心的矩形区域,v表示矩形区域B(u)中的任一像素;含义为:对于像素u∈zt+1,以u为中心的矩形区域B(u)的所有像素求和,即得到了以像素u为中心的目标区域的所有像素属于目标区域的概率和,中的最大值作为第t+1帧的COLOR响应值
...
【专利技术属性】
技术研发人员:凌强,汤峰,李峰,
申请(专利权)人:中国科学技术大学,
类型:发明
国别省市:安徽;34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。