一种图文关联的目标跟踪网络训练方法及系统技术方案

技术编号:43351606 阅读:23 留言:0更新日期:2024-11-19 17:39
本发明专利技术属于计算机视觉、深度学习技术领域,公开了一种图文关联的目标跟踪网络训练方法,本发明专利技术一种图文关联的目标跟踪网络训练方法,该方法包括:每次获取视频序列中的相邻两帧图像,第num帧图像、第num+1帧图像,分别作为训练图像和测试图像,并分别从图像中裁剪出选定目标所在图像块,即第num帧目标图像块、第num+1帧目标图像块;将第num帧目标图像块和第num+1帧目标图像块输入到图文转换模块获得初始文本特征和现有文本特征,提供追踪目标的完整和精确的特征描述;本申请提出的方法能够解决现有的单目标跟踪方法特征提取能力不足、跟踪目标概念模糊、特征提取阶段没有考虑利用相邻键之间的语义上下文的问题,显著提高了单目标跟踪的精度和效率。

【技术实现步骤摘要】

本专利技术属于计算机视觉、深度学习,尤其涉及一种图文关联的目标跟踪网络训练方法。


技术介绍

1、目标跟踪是计算机视觉领域中最重要的研究方向之一,在智能交通领域、自动驾驶领域、监控安防、智能化军事安全等众多领域有着广泛的应用。现有的目标跟踪方法通常以图像块作为参考单位来进行定位跟踪,例如,cvpr 2022公开的论文“mixformer”以及公开号为cn117974722b的中国专利公布的一种“基于注意力机制和改进的transformer的单目标跟踪系统及方法”,都以图像块为参考单位,将transformer作为骨干网络提取所追踪目标的特征,从而执行视觉追踪任务。然而,由于图像的抽象能力有限,单个图像块无法像人类理解自然语言一样,简单直观的表达目标精确的概念,导致现有的目标跟踪方法难以从图像中提取相关程度更大的特征;不仅如此,现有的目标跟踪方法过于强调视频帧的时序信息,忽略了目标外观发生较大变化的可能性,难以跟踪由于运动外观发生剧烈运动的目标。

2、为了克服这些局限性,我们受到文本生成图像领域的启发,引入jong wook kim等人在其论文《l本文档来自技高网...

【技术保护点】

1.一种图文关联的目标跟踪网络训练方法,其特征在于,包括以下步骤:

2.如权利要求1所述图文关联的目标跟踪网络训练方法,其特征在于,所述图文转换模块包括:

3.如权利要求1所述图文关联的目标跟踪网络训练方法,其特征在于,所述特征自适应模块能根据初始文本特征和现有文本特征,生成标签权重可以实时更新的动态文本特征:

4.如权利要求1所述图文关联的目标跟踪网络训练方法,其特征在于,所述改进的transformer特征提取网络包括:

5.如权利要求1所述图文关联的目标跟踪网络训练方法,其特征在于,所述图文关联模块融合了图像特征和文本特征,得到目标状...

【技术特征摘要】

1.一种图文关联的目标跟踪网络训练方法,其特征在于,包括以下步骤:

2.如权利要求1所述图文关联的目标跟踪网络训练方法,其特征在于,所述图文转换模块包括:

3.如权利要求1所述图文关联的目标跟踪网络训练方法,其特征在于,所述特征自适应模块能根据初始文本特征和现有文本特征,生成标签权重可以实时更新的动态文本特征:

4.如权利要求1所述图文关联的目标跟踪网络训练方法,其特征在于,所述改进的transformer特征提取网络包括:

5.如权利要求1所述图文关联的目标跟踪网络训练方法,其特征在于,所述图文关联模块融合了图像特征和文本特征,得到目标状态预测的最终相关特征:

6.如权利要求1所述图文关联的目标跟踪网络训练方法,其特征在于,所述预测模块通过最终相关特征对目标状态进行估...

【专利技术属性】
技术研发人员:罗瑞奇刘锐胡新荣王帮超
申请(专利权)人:武汉纺织大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1