一种基于场景提示的单目标跟踪方法技术

技术编号：37683491 阅读：21 留言：0更新日期：2023-05-28 09:36

本公开提供一种基于场景提示的单目标跟踪方法，对视频图像中的目标进行动态跟踪，包括：确定包含目标的目标模板图像和搜索区域图像并分块；将分块后的目标模板图像和搜索区域图像通过线性映射得到对应的目标模板图像特征和搜索区域图像特征；将目标模板图像特征和搜索区域图像特征输入场景提示的视觉Transformer中，并在动态获取的场景提示符的作用下进行特征交互与增强；利用经过场景提示的视觉Transformer增强后的搜索区域特征回归目标框，并估计目标框的质量；以及跟踪器将目标框质量好的跟踪帧的特征保存在内存中，当到达给定的提示符更新间隔时，场景提示生成器利用内存中保存的特征生成新的场景提示符。用内存中保存的特征生成新的场景提示符。用内存中保存的特征生成新的场景提示符。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于场景提示的单目标跟踪方法

[0001]本公开涉及计算机视觉、人工智能、图像处理
，尤其涉及一种基于场景提示的单目标跟踪方法。

技术介绍

[0002]视觉单目标跟踪是计算机视觉领域中的基础研究课题。其目标是通过给定首帧的目标框，在后续帧中自动定位目标。单目标跟踪在自动驾驶、智能监控、人机交互中有着广泛的应用。
[0003]单目标跟踪方法通过首帧裁剪的模板与当前帧根据上一帧的结果裁剪的搜索区域来定位目标。单目标跟踪方法可以分为双流与单流跟踪器。大部分的现有方法采用双流的跟踪策略，它们独立地提取模板与搜索区域特征，导致所提取的特征无法进行交互从而感知目标，限制了模型的性能。最近，单流的方法被提出来用于联合提取模板与搜索区域特征，通常这些方法基于注意力机制实现了模板与搜索区域的交互，从而可以增强目标的特征。然而，注意力机制无差别地建立像素间的关系，导致一些复杂背景可能被错误地增强，从而影响跟踪器的精度。

技术实现思路

[0004]基于上述问题，本公开提供了一种基于场景提示的单目标跟踪方法，以缓解现有技术中的上述技术问题。
[0005]（一）技术方案本公开提供一种基于场景提示的单目标跟踪方法，对视频图像中的目标进行动态跟踪，包括：确定包含目标的目标模板图像和搜索区域图像并分块；将分块后的目标模板图像和搜索区域图像通过线性映射得到对应的目标模板图像特征和搜索区域图像特征；将目标模板图像特征和搜索区域图像特征输入场景提示的视觉Transformer中，并在动态获取的场景提示符的作用下进...

【技术保护点】

【技术特征摘要】
1.一种基于场景提示的单目标跟踪方法，对视频图像中的目标进行动态跟踪，包括：确定包含目标的目标模板图像和搜索区域图像并分块；将分块后的目标模板图像和搜索区域图像通过线性映射得到对应的目标模板图像特征和搜索区域图像特征；将目标模板图像特征和搜索区域图像特征输入场景提示的视觉Transformer中，并在动态获取的场景提示符的作用下进行特征交互与增强；利用经过场景提示的视觉Transformer增强后的搜索区域特征回归目标框，并估计目标框的质量；以及跟踪器将目标框质量好的跟踪帧的特征保存在内存中，当到达给定的提示符更新间隔时，场景提示生成器利用内存中保存的特征生成新的场景提示符。2.根据权利要求1所述的基于场景提示的单目标跟踪方法，通过场景提示生成器在跟踪过程中动态地从视频时空上下文中获取场景提示符。3.根据权利要求2所述的基于场景提示的单目标跟踪方法，所述场景提示符包括目标提示符和背景提示符。4.根据权利要求1所述的基于场景提示的单目标跟踪方法，通过目标估计头利用经过场景提示的视觉Transformer增强后的搜索区域特征回归目标框，并利用交并比回归头估计目标框的质量。5.根据权利要求1所述的基于场景提示的单目标跟踪方法，...

【专利技术属性】
技术研发人员：张天柱，马银超，尉前进，何建峰，张勇东，
申请(专利权)人：中国科学技术大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人