【技术实现步骤摘要】
基于边界框回归模型的目标跟踪方法
本专利技术属于图像处理
,更进一步涉及计算机视觉图像处理
中的一种基于边界框回归模型的目标跟踪方法。本专利技术采用一种基于边界框回归与自适应模型相结合的方法,实现了视频监控、医疗保健、智能交通、机器人导航、人机交互、虚拟现实等领域的运动目标跟踪。
技术介绍
目标跟踪的主要任务是估计视频中目标的轨迹,即从视频图像序列中检测出待跟踪的运动目标,进而在每一帧图像中确定出运动目标的位置。目标跟踪最流行的方法之一是检测跟踪,检测跟踪通常根据判别式学习模型,在线学习一个二进制分类器将目标和背景分离。这类方法的目标是设计一个鲁棒的分类器,动态捕捉目标和背景的差异性特征,适应跟踪过程中的视角、光照、姿态等变化。西安电子科技大学在其拥有的专利技术“基于相关滤波器的目标跟踪检测方法”(专利申请号201810292983.9,授权公告号CN108596048B)中公开了一种基于相关滤波器的改进目标跟踪检测方法。该方法的步骤是,通过滤波器得到目标响应图的最大值后用阈值进行判断,对效果不好的输出结 ...
【技术保护点】
1.一种基于边界框回归模型的目标跟踪方法,其特征在于,通过构建的边界框回归模型,对滤波器定位的目标位置进行回归调整;该方法的步骤包括如下:/n(1)计算第一帧连续分辨率的空间特征图:/n(1a)将待跟踪目标视频中随机选取含有目标一帧的作为第一帧;/n(1b)使用深度卷积神经网络VGG-19提取第一帧中目标区域离散空间域的特征;/n(1c)利用三次线性插值公式,将每个维度离散空间域特征转换到连续分辨率的空间特征,得到空间特征图;/n(2)从含有待跟踪目标视频图像序列中除第一帧外选取一帧未选过的图像作为当前帧;/n(3)计算当前帧的连续分辨率的空间特征图:/n(3a)使用深度卷 ...
【技术特征摘要】
1.一种基于边界框回归模型的目标跟踪方法,其特征在于,通过构建的边界框回归模型,对滤波器定位的目标位置进行回归调整;该方法的步骤包括如下:
(1)计算第一帧连续分辨率的空间特征图:
(1a)将待跟踪目标视频中随机选取含有目标一帧的作为第一帧;
(1b)使用深度卷积神经网络VGG-19提取第一帧中目标区域离散空间域的特征;
(1c)利用三次线性插值公式,将每个维度离散空间域特征转换到连续分辨率的空间特征,得到空间特征图;
(2)从含有待跟踪目标视频图像序列中除第一帧外选取一帧未选过的图像作为当前帧;
(3)计算当前帧的连续分辨率的空间特征图:
(3a)使用深度卷积神经网络VGG-19提取当前帧中目标区域离散空间域的特征;
(3b)利用三次线性插值公式,将每个维度离散空间域特征转换到连续分辨率的空间特征,得到空间特征图;
(4)计算相关滤波器:
(4a)通过空间特征图并利用特征响应图计算公式,计算相关滤波器在空间特征图上产生的特征响应图;
(4b)利用相关滤波器优化函数,对响应图进行优化,将满足相关滤波器优化函数取到最小值的滤波器作为对应于第一帧中的目标区域的相关滤波器;
(5)构建边界框回归模型:
(5a)利用第一帧中确定的相关滤波器与当前帧中的视频区域进行点乘操作,得到用于预测目标位置的响应图;
(5b)将预测目标位置的响应图中响应最大值区域作为当前帧中预测目标区域的位置;
(5c)计算当前帧中的真实目标区域位置与滤波器预测的目标区域位置之间的移动误差,计算公式如下:
其中,tx表示真实目标区域位置与滤波器预测的目标区域位置之间的横坐标误差,ty表示真实目标区域位置与滤波器预测的目标区域位置之间纵坐标的误差,tw表示真实目标区域位置与滤波器预测的目标区域位置之间宽的误差,th表示真实目标区域位置与滤波器预测的目标区域位置之间高的误差,Gx表示真实目标区域位置的横坐标,Gy表示真实目标区域位置的纵坐标,Gw表示真实目标区域位置的宽,表示真实目标区域位置的高,Px表示滤波器预测的目标区域位置的横坐标,Py表示滤波器预测的目标区域位置的纵坐标,Pw表示滤波器预测的目标区域位置的宽,Ph表示滤波器预测的目标区域位置的高,log表示以10为底的对数;
(5d)通过最小化回归模型损失函数,分别计算边界框回归模型的用于调节预测目标区域位置横坐标、纵坐标、宽和高对应的四个参数,利用四个参数完成边界框回归模型的构建,这四个参数是由下由下式分别计算得到的:
m=argmin((t*-mTθ(P))2+||m||2)
其中,m表示用于调节预测目标区域位置横坐标、纵坐标、宽和高中的任意一个参数,arg...
【专利技术属性】
技术研发人员:田小林,高文星,李芳,张艺帆,王露,杨坤,焦李成,
申请(专利权)人:西安电子科技大学,
类型:发明
国别省市:陕西;61
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。