基于双深度增强网络的步进式目标跟踪方法技术

技术编号:26892466 阅读:33 留言:0更新日期:2020-12-29 16:12
本发明专利技术提供了一种设计目标跟踪网络TNet,用于提取目标的深度卷积特征;对TNet进行离线训练,包括有监督预训练和增强学习训练;设计并训练跟踪结果评估网络ENet,用于输出跟踪过程中的在线采样行为,控制TNet的更新过程;在跟踪过程中利用TNet定位目标,然后根据ENet对当前跟踪结果的评估采样不同的训练样本,在线调整更新TNet,然后进入下一帧跟踪,逐步调整跟踪框成为目标的最小外接矩形。本发明专利技术能够更好地适应目标形变,增强了跟踪的鲁棒性和稳定性。

【技术实现步骤摘要】
基于双深度增强网络的步进式目标跟踪方法
本专利技术涉及视觉跟踪领域,特别涉及基于深度增强学习的精确目标跟踪。
技术介绍
视觉目标跟踪算法的任务是指定视频第一帧目标物体的位置、大小等状态的前提下,在后续帧中预测新的目标状态。随着深度学习,特别是卷积神经网络(CNN)在图像分类、目标检测领域取得巨大的成功,现有的目标跟踪算法大都采用预训练的CNN提取图像特征。SangdooYun,JongwonChoi,YoungjoonYoo,KiminYun,JinYoungChoi在其发表的论文“Action-DecisionNetworksforVisualTrackingwithDeepReinforcementLearning”(2017年IEEEConferenceonComputerVision&PatternRecognition论文集)中公开了ADNet跟踪算法,在利用CNN目标表达能力的同时,首先将目标跟踪嵌入强化学习框,其特点是由一系列深度强化学习得到的行为控制跟踪框,决策过程耗时小,通过调整跟踪框位置,实现了精确的目标跟踪,取得了本文档来自技高网...

【技术保护点】
1.一种基于双深度增强网络的步进式目标跟踪方法,其特征在于包括以下步骤:/n步骤1,设计目标跟踪网络TNet,用于提取目标的深度卷积特征;对TNet进行离线训练,包括有监督预训练和增强学习训练;/n步骤2,设计并训练跟踪结果评估网络ENet,用于输出跟踪过程中的在线采样行为,控制TNet的更新过程;/n步骤3,在跟踪过程中,利用TNet定位目标,然后根据ENet对当前跟踪结果的评估采样不同的训练样本,在线调整更新TNet,然后进入下一帧跟踪,重复本步骤,逐步调整跟踪框成为目标的最小外接矩形。/n

【技术特征摘要】
1.一种基于双深度增强网络的步进式目标跟踪方法,其特征在于包括以下步骤:
步骤1,设计目标跟踪网络TNet,用于提取目标的深度卷积特征;对TNet进行离线训练,包括有监督预训练和增强学习训练;
步骤2,设计并训练跟踪结果评估网络ENet,用于输出跟踪过程中的在线采样行为,控制TNet的更新过程;
步骤3,在跟踪过程中,利用TNet定位目标,然后根据ENet对当前跟踪结果的评估采样不同的训练样本,在线调整更新TNet,然后进入下一帧跟踪,重复本步骤,逐步调整跟踪框成为目标的最小外接矩形。


2.根据权利要求1所述的基于双深度增强网络的步进式目标跟踪方法,其特征在于:所述的步骤1中,TNet的输入为图像块,经过三个以上的卷积层提取图像的深层卷积特征,然后经过两个以上的全连接层后至行为输出层和目标可信度输出层;行为输出层输出4个方向的位移{Tleft,Tright,Tup,Tdown}来准确定位目标中心,输出4个尺度变化{Hexpand,Hshrink,Wexpand,Wshrink}以应对目标长宽方向上不一致的形变,输出终止操作{stop};目标可信度输出层输出为对应的行为置信度。


3.根据权利要求2所述的基于双深度增强网络的步进式目标跟踪方法,其特征在于:所述的4个尺度变化中高度方向和宽度方向上的尺度独立变化。


4.根据权利要求1所述的基于双深度增强网络的步进式目标跟踪方法,其特征在于:所述的步骤1中,利用公开的物体检测数据集,采用有监督学习方法对TNet进行预训练,目标函数定义为多任务交叉熵损失函数LTNet=λ1×Lcross-entropy(conf,conf~)+(1-λ1)×Lcross-entropy(act,act~),其中Lcross-entropy表示经过one-hot形式的交叉熵损失函数,conf、act分别为网络行为输出层和目标可信度输出层的输出,conf~、act~分别为对应的真值,λ1表示两项损失的权重分配。


5.根据权利要求4所述的基于双深度增强网络的步进式目标跟踪方法,其特征在于:所述的λ1取值范围为[0.55,0.73]。


6.根据权利要求1所述的基于双深度增强网络的步进式目标跟踪方法,其特征在于:所述的步骤1中,固定经过预训练的TNet卷积层的网络参数,在多帧图像序列上对其全连接层进行增强学习训练,在序列的每一帧图像中,利用预训练的TNet定位目标...

【专利技术属性】
技术研发人员:陆永安赵柯王暐张波刘传玲周铁军张华付飞亚李嘉计宇张乐
申请(专利权)人:中国人民解放军六三八七五部队
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1