【技术实现步骤摘要】
一种基于残差回归网络的单目标跟踪方法
本专利技术涉及深度学习、单目标跟踪、尤其涉及一种基于残差回归网络的单目标跟踪方法。
技术介绍
目标跟踪技术从上世纪末开始繁荣发展到现在,已经趋于成熟且在无人驾驶、信息安全、人机交互、人工智能等领域得到广泛应用。在某一视频中,随着周围环境的各种变化,通过事先写好的算法使计算机自动识别并跟踪目标物体的过程就是目标跟踪的主要任务。随着社会日新月异的发展,目标跟踪也越来越被各行各业所需要,应用的前景也越来越好。也正是因为如此,目标跟踪在计算机视觉领域变得炙手可热成为主流。目标跟踪可以理解为,在某段视频的图片流中,给定图片流第一帧图片中被跟踪目标的形状和方位,经过目标跟踪算法的计算,在接下来的每一帧图片中都对被跟踪目标的运动轨迹进行精准的预测。现在围绕目标跟踪的算法层出不穷,也在各个领域的应用中得到了良好的反馈。但是在实际应用中由于多种因素的制约和干扰,目标跟踪算法的效果并没有理想中那么好,主要是因为在视频中出现的许多无法抗拒和预测的环境因素,其中包括:物体在视频中从初始帧到当前帧,光照情况发生了激烈的变化;部分区域或全部区域被遮挡;大 ...
【技术保护点】
1.一种基于残差回归网络的单目标跟踪方法,其特征在于包括如下步骤:步骤1、对原始训练数据进行预处理;步骤2、将预处理后的数据输入残差回归网络模型,进行参数训练,并确定好网络参数;步骤3、确定好网络参数后,将待跟踪视频序列按照与步骤1相同的方式进行预处理;步骤4、将待跟踪视频序列的预处理结果输入到残差回归网络模型中,得到跟踪结果。
【技术特征摘要】
1.一种基于残差回归网络的单目标跟踪方法,其特征在于包括如下步骤:步骤1、对原始训练数据进行预处理;步骤2、将预处理后的数据输入残差回归网络模型,进行参数训练,并确定好网络参数;步骤3、确定好网络参数后,将待跟踪视频序列按照与步骤1相同的方式进行预处理;步骤4、将待跟踪视频序列的预处理结果输入到残差回归网络模型中,得到跟踪结果。2.根据权利要求1所述的一种基于残差回归网络的单目标跟踪方法,其特征在于所述原始训练数据是指使用视频和静态图像的组合来训练残差回归网络模型;所述预处理是指如果视频中有多个对象,网络必须接收到视频中被跟踪对象的一些信息;将目标对象的图像输入到网络中;裁剪并缩放前一帧,使其以目标对象为中心,并以此目标为跟踪对象,在当前帧中进行跟踪。3.根据权利要求2所述的一种基于残差回归网络的单目标跟踪方法,其特征在于步骤(2)中所述的残差回归网络模型包括:输入层、初始卷积层、多个残差模块、全连接层和输出层;所述初始卷积层用于对输入的原始训练数据进行卷积;所述多个残差模块用于提取上述卷积后的数据的卷积特征;所述全连接层包括多个节点,用于将上述卷积特征进行分类。4.根据权利要求3所述的一种基于残差回归网络的单目标跟踪方法,其特征在于所述每个残差模块在一开始分为一条主径和一条捷径,并在结束时重新叠加整合。5.根据权利要求4所述的一种基于残差回归网络的单目标跟踪方法,其特征在于在第一个残差模块前存在一个max-pooling(最大池化)操作,用于压缩维度,减小卷积层数误差造成估计均值的偏移;在所述全连接层之后存在一mean-Pooling(平均池化)操作。6.根据权利要求2所述的一种基于残差回归网络的单目标跟踪方法,其特征在于用于训练的视频来自ALOV300++,一个包含314个视频序列的集合;删除与测试集重叠的7个视频,剩下307个视频用于训练模型;在这个数据集中,每5帧视频都被标记被跟踪对象的位置;将这些视频分成251个用于训练模...
【专利技术属性】
技术研发人员:颜成钢,杨洪楠,王瑞海,孙垚棋,张继勇,张勇东,
申请(专利权)人:杭州电子科技大学,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。