【技术实现步骤摘要】
一种车载视频动态目标的搜索与定位方法
本专利技术涉及计算机视觉、深度学习
,具体涉及一种车载视频目标的搜索与定位方法。
技术介绍
目标跟踪技术开始于二十世纪60年代初,但是直到二十世纪70年代后期,当计算机的性能达到了可以处理视频、图像等大规模的数据时,视频运动目标跟踪技术才得到了真正的发展和应用。特别是当光流法被提出后,图像处理以静态为主转向了以动态序列为主,但是随着研究的深入以及视频的复杂度增加,光流法很难满足实时性的要求,难以应用到实际的跟踪系统中,于是出现了许多其他跟踪算法。如基于核密度估计的均值漂移类方法,用加权采样样本(粒子)来近似目标分布概率的粒子滤波类方法,根据与目标模板相关性筛选候选样本的相关滤波类方法等。各种新型的网络设计与改造层出不穷,使得当下深度学习在跟踪领域的研究迅速发展。虽然国内外学者对目标跟踪技术进行了多年研究,也有了不少技术和想法上的突破,目前的跟踪算法仍难以满足实际工程应用的需求。跟踪过程会因各种因素导致结果误差、跟踪漂移,甚至跟踪失败,目标跟踪面临的主要难点如下:(1 ...
【技术保护点】
1.一种车载视频动态目标的搜索与定位方法,其特征在于,包括如下步骤:/n步骤一:输入待处理的视频;/n步骤二:目标运动估计:/nS21:获取视频帧间稠密光流,即视频图像序列中关键帧与当前帧之间每个像素点的运动信息,包括点的移动方向和距离;/nS22:筛选参与预测的像素点,根据筛选出的像素点位置的变化预测新的目标位置;/n步骤三:限定目标搜索范围;/n步骤四:建立深度回归模型并对模型进行训练;/n步骤五:通过步骤四建立的深度回归模型进行目标跟踪检测,所述跟踪检测包括视频特征提取和目标搜索定位。/n
【技术特征摘要】
1.一种车载视频动态目标的搜索与定位方法,其特征在于,包括如下步骤:
步骤一:输入待处理的视频;
步骤二:目标运动估计:
S21:获取视频帧间稠密光流,即视频图像序列中关键帧与当前帧之间每个像素点的运动信息,包括点的移动方向和距离;
S22:筛选参与预测的像素点,根据筛选出的像素点位置的变化预测新的目标位置;
步骤三:限定目标搜索范围;
步骤四:建立深度回归模型并对模型进行训练;
步骤五:通过步骤四建立的深度回归模型进行目标跟踪检测,所述跟踪检测包括视频特征提取和目标搜索定位。
2.一种如权利要求1所述的车载视频动态目标的搜索与定位方法,其特征在于,所述步骤S22中筛选参与预测的像素点的过程包括:
采用前向-后向误差,评估每个像素点的光流估计质量,给定样本点在t帧的初始位置x(t),先追踪它到t+δt帧的位置x(t+δt),再从位置x(t+δt)反向追踪回第t帧,得到回溯位置x'(t),初始位置x(t)和回溯位置x'(t)之间的距离就是该点在t时间的FB反馈误差;
求取当前目标检测框中所有像素点的FB,保留其中误差最小的50%像素点作为最佳追踪点,取这些点的光流中值近似目标中心位移。
3.一种如权利要求2所述的车载视频动态目标的搜索与定位方法,其特征在于,在预测任意第t帧目标中心时,都是以关键帧k为参照,计算k到t帧和t到k帧的光流,最佳追踪点取自第k帧且估算的是第k帧中目标检测框中心到第t帧目标中心的位移。
4.一种如权利要求1所述的车载视频动态目标的搜索与定位方法,其特征在于,所述步骤三中限定目标搜索范围包括:
取两倍于原始目标长宽的搜索范围,即假设第t帧的前一个关键帧k中目标区域大小为(wk,hk),则在t帧中估计目标中心为搜索中心,以长宽为(2wk,2hk)范围为搜索区域。
5.一种如权利要求4所述的车载视频动态目标的搜索与定位方法,其特征在于,所述步骤四中建立深度回归模型包括:
S41:模型输入
回归模型输入为两个样本块的特征拼接:第一个样本块是前一帧中已知目标矩形区域,第二个样本块是靠后帧中矩形搜索区域,第二个样本块的长和宽分别是第一个样本块的长和宽的两倍;两个样本块的特征提取均借助印象网络;
所述模型输入中包含了前面帧已知的目标样本;
S42:模型输出
回归模型输出四个值(x1,y1,x2,y2),表示目标在矩形搜索区域中的左上角和右下角的横纵坐标;
S43:回归网络结构
所述回归网络由四个全连接层构成,每一层都使用ReLU激活函数;前三个全连阶层均为4096个神经元,最后一个全连接层输出四个单元,分别对应样本的四个坐标值;
S44:损失函数选择
模型损失函数包括输出坐标回归损失和模型参数正则化损失;
所述输出坐标回归损失包括:
假设预测目标左上角和右下角相对于搜索区域的坐标为目标实际位置相对于搜索区域的坐标为(x1,y1,x2,y2),搜索区域的宽和高为(w,h),预测误差相对搜索区域大小归一化为:
回归问题采用SmoothL1损失函数:
采用SmoothL1函数计算坐标回归损失:
所述模型参数正则化损失使用L2损失函数f(x)=x2计算,记为R;
综合以上两部分损失,得到整个模型的损失函数表达式如式(4)所示:
loss=Lreg+βR(4)
其中β是正则化损失所贡献的权重。
6.一种如权利要求5...
【专利技术属性】
技术研发人员:郑可尧,邓颖,郑红,梁航,张栋,刘书珍,
申请(专利权)人:北航航空航天产业研究院丹阳有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。