【技术实现步骤摘要】
本专利技术涉及计算机视觉与图像处理,特别涉及一种基于频域块和高效查询注意力的目标跟踪方法与系统。
技术介绍
1、目标跟踪是计算机视觉领域的一个核心任务,其目标是在连续的视频帧或者图像序列中,对一个特定目标的位置和运动状态进行持续的追踪。这项技术在多种应用场景中发挥着关键作用,包括但不限于安全监控、无人驾驶技术、虚拟现实增强以及机器人的路径规划等。在执行目标跟踪时,算法需要面对多种挑战,如目标的外观可能会随时间变化,被其他物体遮挡,因为快速移动而变得模糊,受到周围环境光线变化的影响等。
2、近年来,卷积神经网络(cnn)在众多目标跟踪任务中占据了主导地位,这得益于其通过卷积运算处理图像数据的能力,能够识别图像中的局部特征、且具有平移不变性。然而,由于卷积本质上是一种关注局部邻域的操作,它在整合图像全局信息方面存在不足,这可能导致丢失整体上下文或仅找到局部最优的特征表示。此外,单一的cnn架构在处理更广泛的任务时,其感受野的限制可能成为效率的瓶颈。
3、随着时间的发展,transformer模型因其在全局信息建模方面
...【技术保护点】
1.一种基于频域块和高效查询注意力的目标跟踪方法,其特征在于,所述方法基于预测模型实现,所述预测模型由模板分支模块、搜索分支模块和预测头模块组成,其中,模板分支模块与搜索分支模块的权重共享,所述方法包括如下步骤:
2.根据权利要求1所述的基于频域块和高效查询注意力的目标跟踪方法,其特征在于,在利用模板令牌的二维空间域进行变换计算,得到模板令牌的二维频域的过程中,变换计算的计算关系式为:
3.根据权利要求2所述的基于频域块和高效查询注意力的目标跟踪方法,其特征在于,在所述步骤1中,利用模板令牌的二维空间域进行变换计算,得到模板令牌的二维频域;基于
...【技术特征摘要】
1.一种基于频域块和高效查询注意力的目标跟踪方法,其特征在于,所述方法基于预测模型实现,所述预测模型由模板分支模块、搜索分支模块和预测头模块组成,其中,模板分支模块与搜索分支模块的权重共享,所述方法包括如下步骤:
2.根据权利要求1所述的基于频域块和高效查询注意力的目标跟踪方法,其特征在于,在利用模板令牌的二维空间域进行变换计算,得到模板令牌的二维频域的过程中,变换计算的计算关系式为:
3.根据权利要求2所述的基于频域块和高效查询注意力的目标跟踪方法,其特征在于,在所述步骤1中,利用模板令牌的二维空间域进行变换计算,得到模板令牌的二维频域;基于模板令牌的二维频域,通过门控卷积进行筛选,随后进行逆变换计算,将调制频谱转换回二维空间域,并更新模板令牌,得到更新后的模板令牌,具体步骤如下:
4.根据权利要求3所述的基于频域块和高效查询注意力的目标跟踪方法,其特征在于,在所述步骤2中,将更新后的模板令牌依次通过归一化层和多层感知机层处理后,再通过查询矩阵和参数向量处理,得到全局注意查询向量,并生成全局注意查询向量矩阵,对应过程存在的关系式为:
5.根据权利...
【专利技术属性】
技术研发人员:王军,刘纪龙,谷庚,司英振,尉兴宇,王员云,
申请(专利权)人:南昌工程学院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。