基于高效序列生成的视觉目标跟踪方法、装置和电子设备制造方法及图纸

技术编号:44924110 阅读:21 留言:0更新日期:2025-04-08 19:03
本申请涉及一种基于高效序列生成的视觉目标跟踪方法、装置和电子设备,所述方法包括:对获取的搜索图像、模板图像以及随机初始化的跟踪标记进行处理,得到搜索视觉嵌入和模板视觉嵌入;将搜索和模板视觉嵌入以及跟踪标记连接后进行位置编码,然后采用基于视觉transformer框架的编码器对位置编码结果进行编码,并将跟踪标记编码特征采用跟踪预测头进行处理,得到目标跟踪预测结果;如果目标跟踪预测结果满足预设条件,则将目标跟踪预测结果作为目标跟踪结果;否则采用transformer解码器对编码结构进行解码;根据解码结果采用跟踪预测头进行处理,得到目标跟踪结果。采用本方法提高了前向推理的速度,提高了跟踪速度。

【技术实现步骤摘要】

本申请涉及视觉目标跟踪,特别是涉及一种基于高效序列生成的视觉目标跟踪方法、装置和电子设备


技术介绍

1、目标跟踪一直是计算机视觉领域的热点和难点问题,其定义是给定目标在视频第一帧中的位置和大小(通常是一个紧密包围目标的矩形框),估计出目标在整段视频中的状态信息(位置和大小等)。现有的sota跟踪算法通常采用强大的特征提取主干、复杂的特征融合模块和预测头网络,以在公共基准测试中取得高精度。然而,这些跟踪器具有较高的计算负担和内存使用率,这导致了跟踪延迟和部署挑战,特别是在资源受限的边缘设备上。因此,如何在跟踪精度和效率之间取得良好的平衡仍然是跟踪界面临的一个关键问题。

2、近年来,以seqtrack为代表的跟踪方法将跟踪任务建模为序列生成任务,以其简单的网络架构(transformer编码器-解码器网络架构)和损失函数(交叉熵损失函数)而广受欢迎。seqtrack跟踪过程主要分为两步:1)采用transformer编码器从模板和搜索区域进行联合特征提取和特征融合;2)采用transformer解码器从随机初始化的开始标记(starttoken)本文档来自技高网...

【技术保护点】

1.一种基于高效序列生成的视觉目标跟踪方法,其特征在于,所述方法包括:

2.根据权利要求1所述的基于高效序列生成的视觉目标跟踪方法,其特征在于,随机初始化的跟踪标记的过程包括:采用VIT中对token初始化的方法将跟踪标记进行随机初始化。

3.根据权利要求1所述的基于高效序列生成的视觉目标跟踪方法,其特征在于,将所述搜索视觉嵌入、所述模板视觉嵌入以及随机初始化的跟踪标记连接后进行位置编码,得到位置编码后的输入标记为:

4.根据权利要求1所述的基于高效序列生成的视觉目标跟踪方法,其特征在于,采用基于视觉transformer框架的编码器对位置编码后的所有...

【技术特征摘要】

1.一种基于高效序列生成的视觉目标跟踪方法,其特征在于,所述方法包括:

2.根据权利要求1所述的基于高效序列生成的视觉目标跟踪方法,其特征在于,随机初始化的跟踪标记的过程包括:采用vit中对token初始化的方法将跟踪标记进行随机初始化。

3.根据权利要求1所述的基于高效序列生成的视觉目标跟踪方法,其特征在于,将所述搜索视觉嵌入、所述模板视觉嵌入以及随机初始化的跟踪标记连接后进行位置编码,得到位置编码后的输入标记为:

4.根据权利要求1所述的基于高效序列生成的视觉目标跟踪方法,其特征在于,采用基于视觉transformer框架的编码器对位置编码后的所有输入标记进行全局自注意力操作,得到跟踪标记编码特征和搜索图像编码特征,包括:

5.根据权利要求1所述的基于高效序列生成的视觉目标跟踪方法,其特征在于,所述transformer解码器包括层解码器层;其中每一解码器层包含一个无掩码的多头自注意力块、...

【专利技术属性】
技术研发人员:蒯杨柳李冬冬高智楠陈睿
申请(专利权)人:中国人民解放军国防科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1