System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 模型训练方法、多目标跟踪方法、装置及计算机存储介质制造方法及图纸_技高网

模型训练方法、多目标跟踪方法、装置及计算机存储介质制造方法及图纸

技术编号:40918169 阅读:5 留言:0更新日期:2024-04-18 14:44
本申请提出一种模型训练方法、多目标跟踪方法、多目标跟踪装置以及计算机存储介质。该模型训练方法包括:将待训练图像输入多目标跟踪模型,提取待训练图像的编码特征;将编码特征以及检测查询向量和跟踪查询向量输入多目标跟踪模型的解码器;利用检测查询向量的查询向量在编码特征搜索新出现目标;利用跟踪查询向量的查询向量在编码特征搜索持续出现目标;按照新出现目标、持续出现目标以及真实目标对多目标跟踪模型进行训练。通过上述模型训练方法,使用一个跟踪query的持续跟踪一个目标,使用检测query完成每一帧中新目标的检测,通过一个模型可以实现对目标的持续跟踪以及新出现目标的检测,更加简单有效。

【技术实现步骤摘要】

本申请涉及图像处理,特别是涉及一种模型训练方法、多目标跟踪方法、多目标跟踪装置以及计算机存储介质。


技术介绍

1、随着人工智能的迅速发展,目标的检测与跟踪成为计算机视觉研究领域的热点之一,并得到广泛应用。多目标跟踪任务中,要求跟踪算法在视频所有帧中均能定位到所有目标,并在帧与帧之间能够将同一个目标关联起来,最终形成每一个目标在视频中的完整轨迹,是相比于单目标跟踪任务更为复杂的任务。

2、在多目标跟踪任务中,“tracking-by-detection”即通过检测完成跟踪,已经成为解决多目标跟踪问题的首选范式。它通过将任务分解为两个步骤来简化任务:第一步,在每个帧中独立检测对象位置;第二步,通过关联相应的检测来形成目标的跟踪轨迹。deepsort算法就是这种范式的典型代表。但是deepsort等算法除了需要检测模型提供检测结果外,还需要重识别模型(re-identification)提取不同目标的特征、运动预测模型(如卡尔曼滤波器模型)预测目标的运动轨迹、关联模型(如匈牙利算法)等模块,来实现帧与帧目标的关联,导致整个多目标跟踪系统较为复杂,导致多目标跟踪效率较低。


技术实现思路

1、为解决上述技术问题,本申请提出了一种模型训练方法、多目标跟踪方法、多目标跟踪装置以及计算机存储介质。

2、为解决上述技术问题,本申请提出了一种多目标跟踪模型的模型训练方法,所述模型训练方法包括:

3、将待训练图像输入多目标跟踪模型,提取所述待训练图像的编码特征;>

4、将所述编码特征以及检测查询向量和跟踪查询向量输入所述多目标跟踪模型的解码器;

5、利用所述检测查询向量的查询向量在所述编码特征搜索新出现目标;

6、利用所述跟踪查询向量的查询向量在所述编码特征搜索持续出现目标;

7、按照所述新出现目标、所述持续出现目标以及真实目标对所述多目标跟踪模型进行训练。

8、其中,所述利用所述检测查询向量的查询向量在所述编码特征搜索新出现目标之后,所述模型训练方法还包括:

9、将所述新出现目标输入查询交互模块,将所述新出现目标转化为所述跟踪查询向量的持续出现目标。

10、其中,所述将所述新出现目标转化为所述跟踪查询向量的持续出现目标,包括:

11、利用所述查询交互模块保留所述新出现目标中分类分数高于预设检测阈值的目标,并转化为所述跟踪查询向量的持续出现目标;

12、所述利用所述跟踪查询向量的查询向量在所述编码特征搜索持续出现目标之后,所述模型训练方法还包括:

13、利用所述查询交互模块保留所述持续出现目标中分类分数高于预设跟踪阈值的目标,并根据保留的目标以及转化的目标更新所在的跟踪查询向量。

14、其中,所述利用所述查询交互模块保留所述持续出现目标中分类分数高于预设跟踪阈值的目标,并根据保留的目标以及转化的目标更新所在的跟踪查询向量,包括:

15、利用所述查询交互模块保留所述持续出现目标中分类分数高于预设跟踪阈值的目标;

16、将已有持续出现目标作为位置编码,与所述保留的目标输入自注意力模块中,获取更新的目标;

17、将所述转化的目标和所述更新的目标进行合并,得到更新后的跟踪查询向量。

18、其中,所述提取所述待训练图像的编码特征,包括:

19、利用所述多目标跟踪模型的卷积神经网络编码器对所述待训练图像提取三维编码特征;

20、将所述三维编码特征转变为二维编码特征,作为所述解码器的输入。

21、其中,所述将所述三维编码特征转变为二维编码特征,作为所述解码器的输入,包括:

22、将所述三维编码特征转变为二维编码特征;

23、将所述二维编码特征表示为特征查询向量、特征键向量以及特征值向量,并在所述特征键向量和所述特征查询向量加上所述二维编码特征在所述待训练图像的位置编码,输入自注意力编码器,提取自注意力二维编码特征,作为所述解码器的输入。

24、其中,所述按照所述新出现目标、所述持续出现目标以及真实目标对所述多目标跟踪模型进行训练,包括:

25、按照所述待训练图像的新出现目标、所述持续出现目标以及真实目标,生成所述待训练图像的第一损失值;

26、获取所述待训练图像相邻帧图像的第二损失值;

27、获取所述第一损失值和所述第二损失值的平均损失值;

28、按照所述平均损失值对所述多目标跟踪模型进行训练。

29、为解决上述技术问题,本申请还提出一种多目标跟踪方法,所述多目标跟踪方法包括:

30、将待跟踪图像输入预先训练的多目标跟踪模型;

31、获取所述多目标跟踪模型输出的在所述待跟踪图像新出现的目标,和/或持续出现的跟踪目标;

32、其中,所述多目标跟踪模型通过上述的模型训练方法训练所得。

33、为解决上述技术问题,本申请还提出一种多目标跟踪装置,所述多目标跟踪装置包括存储器以及与所述存储器耦接的处理器;其中,所述存储器用于存储程序数据,所述处理器用于执行所述程序数据以实现如上述的模型训练方法,和/或多目标跟踪方法。

34、为解决上述技术问题,本申请还提出一种计算机存储介质,所述计算机存储介质用于存储程序数据,所述程序数据在被计算机执行时,用以实现上述的模型训练方法,和/或多目标跟踪方法。

35、与现有技术相比,本申请的有益效果是:多目标跟踪装置将待训练图像输入多目标跟踪模型,提取所述待训练图像的编码特征;将所述编码特征以及检测查询向量和跟踪查询向量输入所述多目标跟踪模型的解码器;利用所述检测查询向量的查询向量在所述编码特征搜索新出现目标;利用所述跟踪查询向量的查询向量在所述编码特征搜索持续出现目标;按照所述新出现目标、所述持续出现目标以及真实目标对所述多目标跟踪模型进行训练。通过上述模型训练方法,使用一个跟踪query的持续跟踪一个目标,使用检测query完成每一帧中新目标的检测,通过一个模型可以实现对目标的持续跟踪以及新出现目标的检测,更加简单有效。

本文档来自技高网...

【技术保护点】

1.一种多目标跟踪模型的模型训练方法,其特征在于,所述模型训练方法包括:

2.根据权利要求1所述的模型训练方法,其特征在于,

3.根据权利要求2所述的模型训练方法,其特征在于,

4.根据权利要求3所述的模型训练方法,其特征在于,

5.根据权利要求1所述的模型训练方法,其特征在于,

6.根据权利要求5所述的模型训练方法,其特征在于,

7.根据权利要求1所述的模型训练方法,其特征在于,

8.一种多目标跟踪方法,其特征在于,所述多目标跟踪方法包括:

9.一种多目标跟踪装置,其特征在于,所述多目标跟踪装置包括存储器以及与所述存储器耦接的处理器;

10.一种计算机存储介质,其特征在于,所述计算机存储介质用于存储程序数据,所述程序数据在被计算机执行时,用以实现如权利要求1至7任一项所述的模型训练方法,和/或权利要求8所述的多目标跟踪方法。

【技术特征摘要】

1.一种多目标跟踪模型的模型训练方法,其特征在于,所述模型训练方法包括:

2.根据权利要求1所述的模型训练方法,其特征在于,

3.根据权利要求2所述的模型训练方法,其特征在于,

4.根据权利要求3所述的模型训练方法,其特征在于,

5.根据权利要求1所述的模型训练方法,其特征在于,

6.根据权利要求5所述的模型训练方法,其特征在于,

7.根据权利要求...

【专利技术属性】
技术研发人员:张杨殷俊朱树磊
申请(专利权)人:浙江大华技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1