一种基于三重孪生哈希网络学习的目标跟踪方法技术

技术编号:22239224 阅读:27 留言:0更新日期:2019-10-09 18:58
本发明专利技术公开了一种基于三重孪生哈希网络学习的目标跟踪方法,涉及计算机视觉、目标跟踪及深度学习技术领域。该方法首先构建了一个三重孪生哈希网络,该网络由数据输入层、卷积特征提取层、哈希编码层三部分构成。在网络初始训练过程中,使用训练数据集和随机梯度下降反向传播算法对三重孪生哈希网络进行训练,训练完成后网络即可获得目标定位的初始能力。跟踪过程中则首先将输入图像通过三重孪生区域推荐网络得到相应的候选框,再将候选框输入三重孪生哈希网络进行正向处理,分别计算每个候选框与查询样本的相似度,选择最高相似度的候选框作为跟踪目标对象,从而实现目标跟踪。

A Target Tracking Method Based on Triple Twin Hash Network Learning

【技术实现步骤摘要】
一种基于三重孪生哈希网络学习的目标跟踪方法
本专利技术涉及计算机视觉、目标跟踪及深度学习

技术介绍
目标跟踪是计算机视觉领域中一项非常热门的研究课题,其研究内容是根据给定的一段视频片段自动识别出随后视频序列中要跟踪的目标对象,获取目标连续的位置、外观和运动等信息。目标跟踪广泛应用于军事与民用的智能监控、人机交互、交通监控等领域,具有很强的实用价值。尽管这个研究课题已经被研究了几十年,但它仍是一项具有挑战性的课题。在现实情况下,目标对象容易受到各种因素的干扰,例如光照变化、姿态变化、目标遮挡等,使得开发持续鲁棒的目标跟踪系统成为一项非常具有挑战性的问题。过去几十年以来,目标跟踪的研究取得了长足的发展。从经典的均值漂移(MeanShift)、粒子滤波(ParticleFilter)跟踪算法,到基于检测(Tracking-by-Detection)的跟踪算法及相关滤波(CorrelationFilter)的跟踪算法,再到最近基于深度学习(DeepLearning)的跟踪算法。最近取得的研究进展主要是基于相关滤波的跟踪算法和基于深度学习的跟踪算法。相关滤波的跟踪算法于2012年提出本文档来自技高网...

【技术保护点】
1.一种基于三重孪生哈希网络学习的目标跟踪方法,包括如下步骤:步骤一、目标选取从初始图像中选择并确定要跟踪的目标对象,目标选取过程通过运动目标检测方法自动提取或者人机交互方法手动指定;步骤二、训练数据集生成首先,选取大型分类识别视频数据集,数据集的所有图像均标记对应的目标对象位置坐标信息;然后,通过已知标签制作训练数据集,每一组训练数据集有三组图像对,分别是正样本、查询样本和困难负样本,这三组样本图像对均来源于同一个目标序列;选取其中1000组图像序列,将图像序列中标注框内的部分作为查询样本,并归一化为127×127像素,同时在每一张查询样本周围按相同大小随机选取样本,具体选取规则是与查询样本...

【技术特征摘要】
1.一种基于三重孪生哈希网络学习的目标跟踪方法,包括如下步骤:步骤一、目标选取从初始图像中选择并确定要跟踪的目标对象,目标选取过程通过运动目标检测方法自动提取或者人机交互方法手动指定;步骤二、训练数据集生成首先,选取大型分类识别视频数据集,数据集的所有图像均标记对应的目标对象位置坐标信息;然后,通过已知标签制作训练数据集,每一组训练数据集有三组图像对,分别是正样本、查询样本和困难负样本,这三组样本图像对均来源于同一个目标序列;选取其中1000组图像序列,将图像序列中标注框内的部分作为查询样本,并归一化为127×127像素,同时在每一张查询样本周围按相同大小随机选取样本,具体选取规则是与查询样本交并比IOU大于0.8作为正样本,小于0.6但大于0.3作为困难负样本,分别生成100张正样本和100张困难负样本,最终生成600000组训练数据集;步骤三、三重孪生哈希网络构建与初始化三重孪生哈希网络由数据输入层、卷积特征提取层、哈希编码层三部分构成,卷积特征提取层采用Alexnet网络结构,即5层卷积层和2层全连接层,并采用第7层全连接层的1024个神经元节点作为特征表达;哈希编码层则使这1024个神经元节点,其集合表示为un,经过sgn函数,得到哈希码集合bn=sgn(un),各值为bi∈{+1,-1},该网络损失函数设置为三重似然损失函数,定义为其中,M为训练数据集的组数,这里设定M=600000,θij表示哈希码bi和bj之间的内积,表示为q,p,h分别表示查询样本,正样本,困难负样本,α为设定偏值,这里设定α=10,λ是正则化参数项,用来平衡三重似然损失函数,设定λ=80,能够加速训练过程,并防止反向传播过程中梯度消失,N为1024个神经元节点;构建完三重孪生哈希网络后,则用生成的训练数据集开始进行网络训练,训练时反向传播采用经典的随机梯度下降法,最终网络将输出与查询样本最大相似度的目标对象,获得对目标对象定位的初始能力;步骤四、图像输入在实时处理情况下,提取...

【专利技术属性】
技术研发人员:卢学民权伟周宁邹栋张卫华王晔郭少鹏刘跃平郑丹阳陈锦雄
申请(专利权)人:西南交通大学
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1