【技术实现步骤摘要】
本专利技术属于计算机视觉、深度学习,尤其涉及一种图文关联的目标跟踪网络训练方法。
技术介绍
1、目标跟踪是计算机视觉领域中最重要的研究方向之一,在智能交通领域、自动驾驶领域、监控安防、智能化军事安全等众多领域有着广泛的应用。现有的目标跟踪方法通常以图像块作为参考单位来进行定位跟踪,例如,cvpr 2022公开的论文“mixformer”以及公开号为cn117974722b的中国专利公布的一种“基于注意力机制和改进的transformer的单目标跟踪系统及方法”,都以图像块为参考单位,将transformer作为骨干网络提取所追踪目标的特征,从而执行视觉追踪任务。然而,由于图像的抽象能力有限,单个图像块无法像人类理解自然语言一样,简单直观的表达目标精确的概念,导致现有的目标跟踪方法难以从图像中提取相关程度更大的特征;不仅如此,现有的目标跟踪方法过于强调视频帧的时序信息,忽略了目标外观发生较大变化的可能性,难以跟踪由于运动外观发生剧烈运动的目标。
2、为了克服这些局限性,我们受到文本生成图像领域的启发,引入jong wook k
...【技术保护点】
1.一种图文关联的目标跟踪网络训练方法,其特征在于,包括以下步骤:
2.如权利要求1所述图文关联的目标跟踪网络训练方法,其特征在于,所述图文转换模块包括:
3.如权利要求1所述图文关联的目标跟踪网络训练方法,其特征在于,所述特征自适应模块能根据初始文本特征和现有文本特征,生成标签权重可以实时更新的动态文本特征:
4.如权利要求1所述图文关联的目标跟踪网络训练方法,其特征在于,所述改进的transformer特征提取网络包括:
5.如权利要求1所述图文关联的目标跟踪网络训练方法,其特征在于,所述图文关联模块融合了图像特征和
...【技术特征摘要】
1.一种图文关联的目标跟踪网络训练方法,其特征在于,包括以下步骤:
2.如权利要求1所述图文关联的目标跟踪网络训练方法,其特征在于,所述图文转换模块包括:
3.如权利要求1所述图文关联的目标跟踪网络训练方法,其特征在于,所述特征自适应模块能根据初始文本特征和现有文本特征,生成标签权重可以实时更新的动态文本特征:
4.如权利要求1所述图文关联的目标跟踪网络训练方法,其特征在于,所述改进的transformer特征提取网络包括:
5.如权利要求1所述图文关联的目标跟踪网络训练方法,其特征在于,所述图文关联模块融合了图像特征和文本特征,得到目标状态预测的最终相关特征:
6.如权利要求1所述图文关联的目标跟踪网络训练方法,其特征在于,所述预测模块通过最终相关特征对目标状态进行估...
【专利技术属性】
技术研发人员:罗瑞奇,刘锐,胡新荣,王帮超,
申请(专利权)人:武汉纺织大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。