A target tracking method based on three-branch neural network belongs to the field of computer vision technology. Visual target tracking belongs to video analysis. As an important branch of computer vision, its basic task is to predict the position, region and trajectory of the target in the video sequence according to the position information of the given target in the initial frame. For the low accuracy and slow speed of visual target tracking, it is vulnerable to occlusion, background confusion, size changes, drastic changes in appearance, light changes and so on. A target tracking method based on three-branch neural network is proposed. Different from the traditional visual target tracking technology, the three-branch neural network can express the target robustly, cope with the significant changes in the appearance of the target, distinguish the background better, and effectively avoid the drift of the algorithm. The tracking speed is much faster than other algorithms.
【技术实现步骤摘要】
一种基于三分支神经网络的目标追踪方法
本专利技术属于计算机视觉
,具体涉及一种基于三分支神经网络的目标追踪方法。
技术介绍
视觉目标跟踪属于视频分析,作为计算机视觉领域的一个重要分支,它的基本任务是根据给定的目标在初始帧的位置信息,预测目标在视频序列中的位置、区域以及运动轨迹,从而更进一步地在运动目标识别和分类的基础上完成目标运动姿态的识别、运动趋势预测和异常行为检测等高级视觉任务。追踪器如何在拥有较高的鲁棒性的同时拥有较为准确的识别能力,既能应对目标自身表观的变化还能应对复杂的背景和遮挡,是当前追踪技术面临的主要难题。诸多追踪算法并没有在丢失目标之后重新找回目标的能力,一旦在追踪过程中丢失目标将无法继续准确地追踪,从而无法达到长时间场景下的追踪。当前机器视觉目标追踪技术主要可分为两类:使用深度卷积特征方法和使用深度回归网络方法。前者在已有的目标追踪框架中,使用在图像分类任务的数据集上预训练得到的深度卷积神经网络提取到的特征。后者离线训练一个端到端的深度回归卷积网络或递归神经网络。基于深度卷积网络的目标追踪算法可以有效地利用海量的视频资源提高其准确度,但是深度卷积网络在线训练过程需要强劲的硬件资源和较长的训练时间,使得传统的基于深度卷积网络的目标追踪算法很难在现有的硬件资源设备上达到实时的效果。当前目标追踪领域面临的主要难题有:遮挡、背景混淆、尺寸变化、剧烈的表观变化、光照变化等。
技术实现思路
本专利技术的目的在于提供一种基于三分支神经网络的目标追踪方法,本专利技术提出了三分支目标追踪网络用于提高视觉目标追踪的精度和速度;鲁棒性高、识别性强,足以应对现 ...
【技术保护点】
1.一种基于三分支神经网络的目标追踪方法,其特征在于,包括:(1)目标初始化,设计训练样例以供表观建模;(2)目标表观建模,进行多层级卷积背景表观建模;(3)目标状态搜索,训练三分支神经网络;(4)目标状态更新,利用反馈机制更新目标模型;(5)目标模型优化,重复步骤2、步骤3、步骤4,直到步骤3中loss0达到最小,整体模型达到最优;(6)目标追踪结果展示,显示目标下一步的位置和大小。
【技术特征摘要】
1.一种基于三分支神经网络的目标追踪方法,其特征在于,包括:(1)目标初始化,设计训练样例以供表观建模;(2)目标表观建模,进行多层级卷积背景表观建模;(3)目标状态搜索,训练三分支神经网络;(4)目标状态更新,利用反馈机制更新目标模型;(5)目标模型优化,重复步骤2、步骤3、步骤4,直到步骤3中loss0达到最小,整体模型达到最优;(6)目标追踪结果展示,显示目标下一步的位置和大小。2.根据权利要求1所述的一种基于三分支神经网络的目标追踪方法,其特征在于:所述步骤(1)中设计训练样例以供表观建模具体步骤为(1.1)在t时刻在第t-1帧中,以目标当前时刻所在区域的中心点c=(cx,cy)为中心,目标的尺寸宽和高(w,h)为大小,截取目标区域作为目标区域;(1.2)在t-1时刻,在第t-1帧图片中,以当前时刻目标的位置c=(cx,cy)为中心点,以k2倍目标尺寸(w,h)为大小截取图片作为背景区域,并将其中的目标区域使用整张图像的像素矩阵填充;(1.3)在t时刻,在第t中以目标在第t-1帧的位置为中心点,以k2倍目标尺寸(w,h)的大小截取图片作为搜索区域。3.根据权利要求1所述的一种基于三分支神经网络的目标追踪方法,其特征在于:所述步骤(2)中目标表观建模具体步骤为(2.1)利用处理好的数据集进行表观建模,对网络进行端到端的训练,使得网络具备捕捉视频序列中时间上下文关系;(2.2)分别使用深度神经网络高层和低层的卷积特征训练了两个核相关滤波器;使用高层特征的滤波器从语义等级识别目标,使用低层特征的滤波器从细节纹理等级识别目标,通过综合使用多层卷积特征,并在线学习各个卷积特征的权重,对目标和背景的表观进行精确的建模。4.根据权利要求1所述的一种基于三分支神经网络的目标追踪方法,其特征在于:所述步骤(3)中对目标位置的预测具体步骤为(3.1)搜索区域图片ps、背景区域图片pB和目标区域图片pT,三者独立地作为输入传递到三个分支网络φS、φB和φT;步骤(3.2)使用分支网络φS和φB的输出作为输入学习目标相似性度量函数该函数比较目标φT和搜索区域φS的每一个窗口,与目标φT相似度大窗口将被赋予大的分数,与目标φT相似度小的窗口将被赋予小的分数,搜索最大的得分窗口,并将其作为所预测的目标位置;步骤(3.3)同分支网络φS和φT的输出作为输入学习背景相似性度量函数该函数匹配搜索区域和背景区域,预测目标所在的窗口,该窗口包括...
【专利技术属性】
技术研发人员:关键,漆舒汉,孙建国,刘加贝,林尤添,袁野,
申请(专利权)人:哈尔滨工程大学,
类型:发明
国别省市:黑龙江,23
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。