一种基于多层语义特征与多响应图融合的目标跟踪方法技术

技术编号：23401504 阅读：18 留言：0更新日期：2020-02-22 13:37

本发明专利技术公开了一种基于多层语义特征与多响应图融合的目标跟踪方法，包括：将提取的搜索图像块的多层语义特征分别输入不同分支的卷积层中生成多个响应图，并进行多响应图的融合，融合后得到最终响应图作为回归网络模型的输出；训练、更新模型的参数，将搜索图像块与对应的训练标记图组成训练样本对，送入模型中，直到预定义的损失函数小于设定的阈值或迭代步数超过上限；利用模型进行在线检测，裁剪出与前一帧图像块同样大小的搜索图像块，作为训练好的模型的输入，进行多层语义特征提取与多响应图融合，通过搜索最终响应图的最大值，确定预测的目标位置；提取多个不同尺寸的搜索图像块，通过比较回归响应结果的最大值，确定对应的目标尺寸。

A target tracking method based on multi-layer semantic features and multi response graph fusion

全部详细技术资料下载

【技术实现步骤摘要】
一种基于多层语义特征与多响应图融合的目标跟踪方法
本专利技术涉及目标跟踪领域，尤其涉及一种基于多层语义特征与多响应图融合的目标跟踪方法。
技术介绍
视觉目标跟踪的目的是在视频的每一帧中找到一个紧紧包围目标物体的边界框，它是仅在第一帧中给出目标的边界框时估计视频中未知目标物体位置的问题，这是计算机视觉领域的基本问题之一。与目标检测相比，必须检测已知类中的多个对象并将其定位在单个图像中，由于视频的特性，例如：运动模糊、照明变化、相机和物体的运动、变形和与物体的相互作用(遮挡、物体之间的视觉相似性等)，使得视频中的视觉目标跟踪是更具挑战性的任务。此外，由于大多数视觉目标跟踪应用，例如：自动驾驶、视频监视，需要实时跟踪，因此视觉目标跟踪器必须比视频的帧速率更快地操作。基于相关滤波器的跟踪方法[1]-[5]由于其计算效率和有竞争力的性能而引起了人们的关注，该方法只需要很低的计算量就可以在傅里叶域中学习相关滤波器。Bolme等人[1]提出了误差最小平方和滤波器，Henriques等人[3]提出了具有多通道特征的核化相关滤波器(KCFs)，Hong等人[4]提出了使用短期相关跟踪器和长期存储器的组合系统。为了克服手工特征的不充分表现，在相关滤波器[6,7]中使用了深度卷积特征，从而实现了最先进的性能。然而，这些方法需要大量的计算负荷，因为需要使用深度卷积特征来训练多个按比例缩放的滤波器。基于相关滤波器的跟踪器虽然实现了可区分的性能，然而傅立叶域中的相关优化会引起边界效应。与传统的基于相关滤波器的跟踪器不同，深度回归...

【技术保护点】
1.一种基于多层语义特征与多响应图融合的目标跟踪方法，其特征在于，所述方法包括：/n将提取的多层语义特征分别输入不同分支的卷积层中生成多个响应图，并进行多响应图的融合，融合后得到最终响应图作为回归网络模型的输出；/n训练、更新回归网络模型的参数，回归网络模型的训练标记图由高斯函数生成，将搜索图像块与训练标记图组成的训练样本对，送入回归网络模型中，直到预定义的损失函数小于设定的阈值或迭代步数超过上限，回归网络型训练结束；/n利用训练好的回归网络模型进行在线检测，裁剪出与前一帧图像块同样大小的搜索图像块，将此裁剪的搜索图像块作为训练好的回归网络模型的输入，进行多层语义特征提取与多响应图融合，通过搜索最终响应图的最大值，作为回归响应结果，确定预测的目标物体的位置；/n提取多个不同尺寸的搜索图像块，分别送入回归网络模型中，对应得到多个最终响应图，通过比较回归响应结果的最大值，确定对应的目标尺寸。/n

【技术特征摘要】
1.一种基于多层语义特征与多响应图融合的目标跟踪方法，其特征在于，所述方法包括：
将提取的多层语义特征分别输入不同分支的卷积层中生成多个响应图，并进行多响应图的融合，融合后得到最终响应图作为回归网络模型的输出；
训练、更新回归网络模型的参数，回归网络模型的训练标记图由高斯函数生成，将搜索图像块与训练标记图组成的训练样本对，送入回归网络模型中，直到预定义的损失函数小于设定的阈值或迭代步数超过上限，回归网络型训练结束；
利用训练好的回归网络模型进行在线检测，裁剪出与前一帧图像块同样大小的搜索图像块，将此裁剪的搜索图像块作为训练好的回归网络模型的输入，进行多层语义特征提取与多响应图融合，通过搜索最终响应图的最大值，作为回归响应结果，确定预测的目标物体的位置；
提取多个不同尺寸的搜索图像块，分别送入回归网络模型中，对应得到多个最终响应图，通过比较回归响应结果的最大值，确定对应的目标尺寸。

2.根据权利要求1所述的一种基于多层语义特征与多响应图融合的目标跟踪方法，其特征在于，所述提取的多层语义特征具体为：
首先进行回归网络模型的初始化，回归网络模型的输入为一个搜索图像块，输出为回归响应图；
使用深度网络VGG16中的不同层对搜索图像块进行多层语义特征提取。

3.根据权利要求1所述的一种基于多层语义特征与多响应图融合的目标跟踪方法，其特征在于，所述将提取的多层语义特征分别输入不同分支的卷积层中生成多个响应图，并进行多响应图的融合具体为：
将深度网络VGG16中的conv4...

【专利技术属性】
技术研发人员：刘安安，张春婷，刘婧，苏育挺，
申请(专利权)人：天津大学，
类型：发明
国别省市：天津;12

全部详细技术资料下载我是这个专利的主人