一种无监督相似性判别学习的目标跟踪方法技术

技术编号：22817566 阅读：18 留言：0更新日期：2019-12-14 13:19

本发明专利技术公开了一种无监督相似性判别学习的目标跟踪方法，涉及计算机视觉目标跟踪技术领域。采用t‑SNE将特征进行降维和聚类，得到图像类别伪标签及类别总数，然后将该伪标签作为图像真实标签，并将图像特征输入全连接层并进行分类，网络进行反向传播训练。训练完成后，网络具备了图像相似性判别能力。跟踪过程中，首先根据第一帧图像的目标位置，在当前输入帧对应的目标周围交并比IOU>0.8得到待搜索区域，并使用粒子滤波获取目标候选块，再通过无监督相似性特征提取层获取目标候选块的特征，最后分类层将输出每一个目标候选块的置信度，然后将具有最大置信度的目标候选块作为目标图像块完成目标定位，从而实现对目标对象的跟踪。

A target tracking method for unsupervised similarity discrimination learning

全部详细技术资料下载

【技术实现步骤摘要】
一种无监督相似性判别学习的目标跟踪方法
本专利技术涉及计算机视觉，机器学习，目标跟踪

技术介绍
目标跟踪作为计算机视觉领域的一个重要研究方向，目前已受到了广泛的关注。该技术在安全监控、无人驾驶和军事防御等领域具有宽广的应用前景。2013年以来，深度学习方法开始在目标跟踪领域展露头脚，并逐渐在性能上超越传统方法，取得巨大的突破，由于其强大的特征表达能力和强大的数据集和软硬件支持，深度学习已在许多方面取得了惊人的成功，例如语音识别、图像识别、目标检测、视频分类等。2012年AlexKrizhevsky等提出了基于Alexnet网络的大型图像库分类识别的方法，证明了深度卷积神经网络对图像的强大表征能力，2014年KarenSimonyan等提出了基于VGGNet网络的大型图像分类识别方法，更进一步的降低了图像分类识别误差。传统的深度模型有效性来自于海量的有标注训练数据集，而现实情况下这种海量的有标注的视频图像数据集十分匮乏，所以无监督学习逐渐成为机器学习领域的一个热点。无监督学习也是机器学习和人工智能领域的一个重要分支，其在机器学习、数据挖掘、生物医学大数据分析、数据科学等领域有着重要地位。无监督学习的作用是在设计分类器时候，用于处理未被分类标记的样本集，其可以大大减少人工标注带来的人力、物力的耗费。近年来的基于深度学习方法的目标跟踪研究中，无论是基于深度学习分类、回归还是模板匹配方法，都需要使用大量的人工标注图片用于训练模型。然而，实际跟踪场景并没有大量的真实标注图片，所以将无监督学习用于目标跟踪可极大...

【技术保护点】
1.一种无监督相似性判别学习的目标跟踪方法，包括如下步骤：/n步骤一、目标选取/n从初始图像中选择并确定要跟踪的目标对象，目标选取过程通过运动目标检测方法自动提取或者人机交互方法手动指定；/n步骤二、训练数据集生成/n训练数据集生成分为两个步骤，首先是数据集的选取，然后是数据集的制作；选取目标跟踪数据集OTB 2015作为训练数据集，并从中选取其中一类进行数据集的制作，具体为，在每一个图像帧中按行和列进行图像块的循环移动，移动步长为10个像素，图像块尺寸大小为127×127像素，每一帧图像生成500个循环移动的图像块，若训练数据集共有M张图像帧，则最终则生成500×M个图像块；/n步骤三、无监督相似性判别网络的构建与训练/n该网络由特征提取层、聚类层和分类层三部分构成，采用在大型分类识别数据集ImageNet上预训练的VGG-16前16层作为特征提取层，并将得到的特征输入无监督聚类层，利用t-SNE降维得到数据的低维分布，将数据间欧式距离转化为相互间的条件概率，从而表示相互之间的相似度；具体为，给定L个高维特征X

【技术特征摘要】
1.一种无监督相似性判别学习的目标跟踪方法，包括如下步骤：
步骤一、目标选取
从初始图像中选择并确定要跟踪的目标对象，目标选取过程通过运动目标检测方法自动提取或者人机交互方法手动指定；
步骤二、训练数据集生成
训练数据集生成分为两个步骤，首先是数据集的选取，然后是数据集的制作；选取目标跟踪数据集OTB2015作为训练数据集，并从中选取其中一类进行数据集的制作，具体为，在每一个图像帧中按行和列进行图像块的循环移动，移动步长为10个像素，图像块尺寸大小为127×127像素，每一帧图像生成500个循环移动的图像块，若训练数据集共有M张图像帧，则最终则生成500×M个图像块；
步骤三、无监督相似性判别网络的构建与训练
该网络由特征提取层、聚类层和分类层三部分构成，采用在大型分类识别数据集ImageNet上预训练的VGG-16前16层作为特征提取层，并将得到的特征输入无监督聚类层，利用t-SNE降维得到数据的低维分布，将数据间欧式距离转化为相互间的条件概率，从而表示相互之间的相似度；具体为，给定L个高维特征XT＝x1,…,xL，这里x1,...,xL为特征提取层提取的L张图像的卷积特征，其中以xi为中心，按高斯分布选择xj作为近邻点的条件概率为其中σi为方差；需要根据困惑度大小来调节σi，其中表示Pi的熵，困惑度大小与σi大小呈正相关关系，这里设定困惑度为50；对于低维度下的yi，设定高斯分布的方差为则低维度数据之间的相似度为需要迭代优化高维和低维数据分布之间的KL散度，使低维数据分布拟合高维数据分布，目标函数为
迭代初始令并用高斯分布N(0,10-4I)随机初始化低维数据分布YT＝y1,...,yL，这里y1,...,yn为聚类后的数据特征，从t＝1迭代至t＝T，这里设定T＝1000，迭代步骤分为3步，分别是计算低维数据的联合概率计算梯度值并更新低维的数据分布其中qij表示yi和yj之间的相似度，Y(t)表示迭代t次的解，λ表示学习速率，m(t)表示迭代t次的动量，这里设置λ＝50；迭代聚类完成后，最终得到的数据分布YT＝y...

【专利技术属性】
技术研发人员：卢学民，权伟，邹栋，周宁，张卫华，刘跃平，郭少鹏，彭宇晨，侯思帧，郑丹阳，郭永成，陈锦雄，
申请(专利权)人：西南交通大学，
类型：发明
国别省市：四川;51

全部详细技术资料下载我是这个专利的主人