一种基于深度残差网络的随机蕨目标跟踪方法技术

技术编号：20222274 阅读：32 留言：0更新日期：2019-01-28 20:37

本发明专利技术公开了一种基于深度残差网络的随机蕨目标跟踪方法，涉及计算机视觉及模式识别技术领域。从初始图像中选择并确定要跟踪的目标对象，检测器构建与初始化；组成的图像序列并按照时间顺序，逐个提取帧图像作为输入图像；跟踪过程中短时跟踪器在以上次确定的目标位置为中心的搜索区域与目标图像块做比较；提取目标图像块作为正样例，并在其周围选取背景图像块作为负样例，生成在线训练集并输入到检测器；检测器对整个图像区域执行目标检测，比较所有测试图像块的目标概率，将具有最大目标概率的测试图像块所对应的位置作为目标所在的位置，目标定位完成。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度残差网络的随机蕨目标跟踪方法
本专利技术涉及计算机视觉及模式识别

技术介绍
视觉目标跟踪是计算机视觉领域的重要研究课题，其主要任务是获取目标连续的位置、外观和运动等信息，进而为进一步的语义层分析(如行为识别、场景理解等)提供基础。目标跟踪研究被广泛应用于智能监控、人机交互、自动控制系统等领域，具有很强的实用价值。目前，目标跟踪方法主要包括经典目标跟踪方法和深度学习目标跟踪方法。经典的目标跟踪方法主要分为生成式方法(GenerativeMethods)和判别式方法(DiscriminativeMethods)两类。生成式方法假设目标可以通过某种生成过程或者模型进行表达，如主成分分析(PCA)，稀疏编码(SparseCoding)等，然后将跟踪问题视为在感兴趣的区域中寻找最可能的候选项。这些方法旨在设计一种利于鲁棒目标跟踪的图像表示方法。不同于生成式方法，判别式方法将跟踪视为一个分类或者一种连续的对象检测问题，其任务是将目标从图像背景中分辨出来。这类方法同时利用目标和背景信息，是目前主要研究的一类方法。判别式方法通常包含两个主要的步骤，第一步是通过选择能够辨别目标和背景的视觉特征训练得到一个分类器及其决策规则，第二步是在跟踪过程中将该分类器用于对视场内的每一个位置进行评价并确定最有可能的目标位置。随后将目标框移动到该位置并重复这样的过程，进而实现跟踪，该框架被用于设计出各种形式的跟踪算法。总体来看，经典跟踪方法的主要优势在于运行速度和对辅助数据较少的依赖，同时它们也需要在跟踪的准确性与实时性之间做出权衡。Breiman提出了随机森林算法，...

【技术保护点】
1.一种基于深度残差网络的随机蕨目标跟踪方法，包括如下步骤：步骤一、目标选取：从初始图像中选择并确定要跟踪的目标对象，目标选取过程通过运动目标检测自动提取，或者通过人机交互方法人工指定；步骤二、检测器构建与初始化：这里检测器包含深度残差网络和随机蕨两个部分，其中深度残差网络用于特征表达，而随机蕨用于计算目标概率，进而实现对目标的检测与定位；对于随机蕨，这里采用两点比较特征作为随机蕨的特征，该两点比较特征为比较两个值的大小，若第一个值大于第二个值，则第一个值的特征值为1，否则特征值为0；根据随机蕨的结构特性，如果一个蕨采用N个两点比较特征，则该蕨包含2N个叶节点，每个叶节点对应一个N位的二进制编码值；对于深度残差网络，这里采用预训练网络ResNet‑50对图像进行特征表达，输入图像经过224×224像素大小的尺度归一化后作为ResNet‑50网络的输入数据；这里将ResNet‑50的174层作为特征表达层，它有2048个值输出，在这2048个值中随机选择两个不同的值构成两点比较特征，并选择8个不同的两点比较特征为一组，一共选择128组，相应地，根据每一组的8个两点比较特征构成一个蕨，一共...

【技术特征摘要】
1.一种基于深度残差网络的随机蕨目标跟踪方法，包括如下步骤：步骤一、目标选取：从初始图像中选择并确定要跟踪的目标对象，目标选取过程通过运动目标检测自动提取，或者通过人机交互方法人工指定；步骤二、检测器构建与初始化：这里检测器包含深度残差网络和随机蕨两个部分，其中深度残差网络用于特征表达，而随机蕨用于计算目标概率，进而实现对目标的检测与定位；对于随机蕨，这里采用两点比较特征作为随机蕨的特征，该两点比较特征为比较两个值的大小，若第一个值大于第二个值，则第一个值的特征值为1，否则特征值为0；根据随机蕨的结构特性，如果一个蕨采用N个两点比较特征，则该蕨包含2N个叶节点，每个叶节点对应一个N位的二进制编码值；对于深度残差网络，这里采用预训练网络ResNet-50对图像进行特征表达，输入图像经过224×224像素大小的尺度归一化后作为ResNet-50网络的输入数据；这里将ResNet-50的174层作为特征表达层，它有2048个值输出，在这2048个值中随机选择两个不同的值构成两点比较特征，并选择8个不同的两点比较特征为一组，一共选择128组，相应地，根据每一组的8个两点比较特征构成一个蕨，一共产生128个蕨，每个蕨有28＝256个叶节点，每个叶节点对应一个8位的二进制编码值，叶节点对应的编码值范围为00000000～11111111，叶节点的编码值代表了对应的8个两点比较特征的取值；通过以步骤一中确定的目标图像块为正样例，以及在其周围选取的背景图像块为负样例生成初始训练集，选取的正、负样例均与目标具有相同的大小；将这些样例逐个输入到检测器，首先，每个样例通过ResNet-50网络正向处理后输出获得2048个值，然后按照随机蕨的构成，计算每个蕨的8个两点比较特征值进而得到与其对应的二进制编码值，接着将该二进制编码值对应的叶节点中的正样例累加器变量N+或者负样例累加变量N-加1，即如果此次输入到检测器训练的样例是正样例，则N+加1，如果此次输入到检测器训练的样例是负样例，则N-加1；初始时，所有蕨的叶节点的正样例累加器变量N+和负样例累加变量N-均初始化为0；步骤三、图像输入：在实时处理情况下，提取通过摄像头采集并保存在存储区的视频...

【专利技术属性】
技术研发人员：权伟，高仕斌，李天瑞，赵丽平，陈金强，陈锦雄，卢学民，刘跃平，王晔，
申请(专利权)人：西南交通大学，
类型：发明
国别省市：四川,51

全部详细技术资料下载我是这个专利的主人