一种基于孪生神经网络的目标跟踪方法技术

技术编号：28220744 阅读：22 留言：0更新日期：2021-04-28 09:43

本发明专利技术实施例公开一种基于孪生神经网络的目标跟踪方法及系统。属于计算机视觉领域，包括：通过获取待跟踪目标图像和待搜索图像；将获取的待跟踪目标图像和待搜索图像分别输入到孪生神经网络模型中，孪生神经网络模型输出待跟踪目标图像在待搜索图像中的位置。本发明专利技术基于孪生神经网络实现目标跟踪，减少了计算复杂度，提高了目标跟踪的实时性。将残差单元引入孪生神经网络中的孪生网络的两个子网中，解决卷积神经网络深度加深所带来的性能退化问题，使得所构建的孪生神经网络模型在层次较多时也有稳定分支可进行网络梯度回传，利用分支并行定位分割网络在提高目标跟踪精度的同时也兼顾了目标跟踪的速度。时也兼顾了目标跟踪的速度。时也兼顾了目标跟踪的速度。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于孪生神经网络的目标跟踪方法

[0001]本专利技术属于计算机视觉
，具体涉及一种基于孪生神经网络的目标跟踪方法。

技术介绍

[0002]图像信息是人类感知世界并获取外界信息的一个重要来源，其中，目标跟踪是图像信息理解中一个十分常见又重要的视觉任务，是计算机视觉的一个重要分支。目标跟踪是通过在第一帧选定标注目标，实现在后续视频序列中连续跟踪变化的目标，对后续帧进行目标定位。近年来，由于无人驾驶、机器人及视频监控等领域的发展及技术需求，目标跟踪技术受到越来越多的研究人员的重视。
[0003]近年来，国内外学者提出了很多跟踪算法，主要可以分为两大类：一类是基于生成式模型的目标跟踪算法，另一类是基于判别式模型的目标跟踪算法。其中，生成式模型着重于对目标本身进行描述和进一步刻画从而建立目标外观模型的表征，利用建立的目标模型的表征在后续帧图像中定位目标位置，优点在于在具有挑战性的跟踪问题中有较好表现，但会增加计算复杂度；判别式模型实质上是将目标跟踪问题转换成目标和背景的二分类问题，通过利用机器学习技术来区分图像中的前景目标及背景，进而确定目标的位置，该类方法在判断目标及背景前需要进行特征的提取来提高判断的准确度，但是会由于大量候选样本需要进行特征提取使得算法无法实现实时性。
[0004]通过近几年计算机视觉方面的顶会中表现较好的目标跟踪算法可以看出，其中主要是通过相关滤波方法及深度学习方法实现目标跟踪。2014年， Henriques提出了CSK的改进算法KCF，该算法...

【技术保护点】

【技术特征摘要】
1.一种基于孪生神经网络的目标跟踪方法，其特征在于，包括：获取待跟踪目标图像和待搜索图像；将获取的待跟踪目标图像和待搜索图像分别输入到孪生神经网络模型中，孪生神经网络模型输出待跟踪目标图像在待搜索图像中的位置。2.根据权利要求1所述的方法，其特征在于，孪生神经网络模型包括孪生网络和分支并行定位分割网络，所述孪生网络使用两个卷积神经网络分别对待跟踪目标图像和待搜索图像进行特征提取，将提取到的目标图像和搜索图像的特征进行深度可分离卷积，获得初始响应图；所述分支并行定位分割网络根据所述初始响应图，输出所述待跟踪目标图像在待搜索图像中的位置。3.根据权利要求2所述的方法，其特征在于，所述分支并行定位分割网络包括：分类器子网，所述分类器子网包括两个卷积层，每个卷积层由1个卷积单元构成；定位回归子网，所述定位回归子网包括两个卷积层，每个卷积层由1个卷积单元构成；分割掩码子网，所述分割掩码子网有两个卷积层，每个卷积层由1个卷积单元构成。4.根据权利要求3所述的方法，其特征在于，所述分类器子网根据所述初始响应图，得到得分矩阵结果，用于区分待跟踪目标图像和背景；所述定位回归子网根据所述初始响应图，得到位置信息矩阵，用于估计待跟踪目标图像的矩形边界框的具体位置和长宽；所述分割掩码子网根据所述初始响应图，得到二进制分割掩码，用于获取估计的目标掩码。5.根据权利要求2所述方法，其特征在于，所述两个卷积神经网络构成的子网为目标图像子网和搜索图像子网；所述目标图像子网和所述搜索图像子网均是由五层卷积层构成，五层卷积层分别是：第一层卷积层由1个卷积单元构成，该卷积单元卷积核大小为7
×
7，第二层卷积层由3个残差单元构成，每个残差单元分别由大小为1
×
1的卷积核和3
×
3的卷积核交叠组成，第三个卷积层由1个残差单元构成，每个残差单元分别由大小为1
×
1的卷积核和3
×
3的卷积核交叠组成，第四层卷积层3个残差单元构成，每个残差单元分别由大小为1
×
1的卷积核和3
×
3的卷积核交叠组成，第五层卷积层由1个卷积单元构成，该卷积单元卷积核大小为1
×
1。6.根据权利要求2所述的方法，其特征在于，所述孪生神经网络模型的训练方法，包括：获取目标视频序列数据集；对目标视频序列数据集中的图像帧进行图像预处理，得到目标图像训练集和搜索图像训练集；基于目标图像训练集和搜索图像训练集，训练孪生神经网络模型；利用损失函数作为目标函数计算输出结果与标签真实值之间的误差，对孪生神经网络模型中的参数进行调整；直至目标函数误差值收敛于最小值或达到迭代次数，得到训练好的孪生神经网络模型。7.根据权利要求5所述的方法，其特征在于，所述基于目标图像训练集和搜索图像训练
集，训练孪生神经网络模型，包括：从目标视频序列数据集中随机抽取一帧作为目标图像子网的输入；将目标视频序列数据集中随机抽取一帧的下一帧作为搜索图像子网的输入。8.根据权利要求2所述的方法，其特征在于，所述将提...

【专利技术属性】
技术研发人员：王勇，刘红旗，李新潮，谢文洁，金琳淇，
申请(专利权)人：吉林大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人