目标追踪模型的训练方法及装置制造方法及图纸

技术编号:39188409 阅读:11 留言:0更新日期:2023-10-27 08:35
本申请提供了一种目标追踪模型的训练方法及装置。该方法包括:在残差神经网络的第一阶段网络和第二阶段网络之间插入第一分片注意力网络,其中,第一分片注意力网络具有K个分片注意力分支;在残差神经网络的第二阶段网络和第三阶段网络之间插入第二分片注意力网络,其中,第二分片注意力网络具有N个分片注意力分支;在残差神经网络的第三阶段网络和第四阶段网络之间插入第三分片注意力网络,其中,第三分片注意力网络具有M个分片注意力分支,K、N和M依次增大;将插入三个分片注意力网络后的残差神经网络的作为目标追踪模型,对目标追踪模型进行训练。模型进行训练。模型进行训练。

【技术实现步骤摘要】
目标追踪模型的训练方法及装置


[0001]本申请涉及目标检测
,尤其涉及一种目标追踪模型的训练方法及装置。

技术介绍

[0002]目标追踪(Person re

identification)也称行人再识别,是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术。现有技术也将注意力机制应用到目标追踪模型中,但是现有的注意力机制无法做到和人一样在观察一个对象时逐渐缩小观察区域的,即现有的注意力机制无法实现逐渐缩小注意力区域,以提取到更加有效的特征,这导致目标追踪模型的精度还有待进一步提高。

技术实现思路

[0003]有鉴于此,本申请实施例提供了一种目标追踪模型的训练方法、装置、电子设备及计算机可读存储介质,以解决现有技术中,现有的注意力机制无法像人一样逐渐缩小注意力区域,提取更加有效的特征,导致目标追踪模型的精度有待进一步提高。
[0004]本申请实施例的第一方面,提供了一种目标追踪模型的训练方法,包括:在残差神经网络的第一阶段网络和第二阶段网络之间插入第一分片注意力网络,其中,第一分片注意力网络具有K个分片注意力分支,残差神经网络依次有第零阶段网络、第一阶段网络、第二阶段网络、第三阶段网络和第四阶段网络串行连接组成;在残差神经网络的第二阶段网络和第三阶段网络之间插入第二分片注意力网络,其中,第二分片注意力网络具有N个分片注意力分支;在残差神经网络的第三阶段网络和第四阶段网络之间插入第三分片注意力网络,其中,第三分片注意力网络具有M个分片注意力分支,K、N和M依次增大;将插入三个分片注意力网络后的残差神经网络的作为目标追踪模型,对目标追踪模型进行训练。
[0005]本申请实施例的第二方面,提供了一种目标追踪模型的训练装置,包括:第一构建模块,被配置为在残差神经网络的第一阶段网络和第二阶段网络之间插入第一分片注意力网络,其中,第一分片注意力网络具有K个分片注意力分支,残差神经网络依次有第零阶段网络、第一阶段网络、第二阶段网络、第三阶段网络和第四阶段网络串行连接组成;第二构建模块,被配置为在残差神经网络的第二阶段网络和第三阶段网络之间插入第二分片注意力网络,其中,第二分片注意力网络具有N个分片注意力分支;第三构建模块,被配置为在残差神经网络的第三阶段网络和第四阶段网络之间插入第三分片注意力网络,其中,第三分片注意力网络具有M个分片注意力分支,K、N和M依次增大;训练模块,被配置为将插入三个分片注意力网络后的残差神经网络的作为目标追踪模型,对目标追踪模型进行训练。
[0006]本申请实施例的第三方面,提供了一种电子设备,包括存储器、处理器以及存储在存储器中并且可在处理器上运行的计算机程序,该处理器执行计算机程序时实现上述方法的步骤。
[0007]本申请实施例的第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述方法的步骤。
[0008]本申请实施例与现有技术相比存在的有益效果是:因为本申请实施例通过在残差神经网络的第一阶段网络和第二阶段网络之间插入第一分片注意力网络,其中,第一分片注意力网络具有K个分片注意力分支,残差神经网络依次有第零阶段网络、第一阶段网络、第二阶段网络、第三阶段网络和第四阶段网络串行连接组成;在残差神经网络的第二阶段网络和第三阶段网络之间插入第二分片注意力网络,其中,第二分片注意力网络具有N个分片注意力分支;在残差神经网络的第三阶段网络和第四阶段网络之间插入第三分片注意力网络,其中,第三分片注意力网络具有M个分片注意力分支,K、N和M依次增大;将插入三个分片注意力网络后的残差神经网络的作为目标追踪模型,对目标追踪模型进行训练。采用上述技术手段,可以解决现有技术中,现有的注意力机制无法像人一样逐渐缩小注意力区域,提取更加有效的特征,导致目标追踪模型的精度有待进一步提高,进而提高目标追踪模型的精度。
附图说明
[0009]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
[0010]图1是本申请实施例提供的一种目标追踪模型的训练方法的流程示意图;图2是本申请实施例提供的另一种目标追踪模型的训练方法的流程示意图;图3是本申请实施例提供的一种目标追踪模型的训练装置的结构示意图;图4是本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
[0011]以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
[0012]图1是本申请实施例提供的一种目标追踪模型的训练方法的流程示意图。图1的目标追踪模型的训练方法可以由计算机或服务器,或者计算机或服务器上的软件执行。如图1所示,该目标追踪模型的训练方法包括:S101,在残差神经网络的第一阶段网络和第二阶段网络之间插入第一分片注意力网络,其中,第一分片注意力网络具有K个分片注意力分支,残差神经网络依次有第零阶段网络、第一阶段网络、第二阶段网络、第三阶段网络和第四阶段网络串行连接组成;S102,在残差神经网络的第二阶段网络和第三阶段网络之间插入第二分片注意力网络,其中,第二分片注意力网络具有N个分片注意力分支;S103,在残差神经网络的第三阶段网络和第四阶段网络之间插入第三分片注意力网络,其中,第三分片注意力网络具有M个分片注意力分支,K、N和M依次增大;S104,将插入三个分片注意力网络后的残差神经网络的作为目标追踪模型,对目标追踪模型进行训练。
[0013]残差神经网络,比如ResNet50,包含第零阶段网络Stage0、第一阶段网络Stage1、第二阶段网络Stage2、第三阶段网络Stage3和第四阶段网络Stage4。构建的目标追踪模型内部网络依次是:有第零阶段网络、第一阶段网络、第一分片注意力网络、第二阶段网络、第二分片注意力网络、第三阶段网络、第三分片注意力网络和第四阶段网络。
[0014]因为随着特征的进一步处理,也就是目标追踪模型内部网络的深入,特征是越来越详细的,所以三个分片注意力网络内的分片注意力分支的数量K、N和M是依次增大的,这有利用提取到更加有效的特征。需要说明的是,K、N和M依次增大即可,可以是奇数或偶数,可以是彼此之间有倍数关系也可以是没有倍数关系等,没有其它要求,比如K、N和M分别为2、4和8。
[0015]根据本申请实施例提供的技术方案,在残差神经网络的第一阶段网络和第二阶段网络之间插入第一分片注意力网络,其中,第一分片注意力网络具有K个分片注意力分支,残差神经网络依次有第零阶段网络、第一阶段网络、第二阶段网络、第三阶段网络本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种目标追踪模型的训练方法,其特征在于,包括:在残差神经网络的第一阶段网络和第二阶段网络之间插入第一分片注意力网络,其中,所述第一分片注意力网络具有K个分片注意力分支,所述残差神经网络依次有第零阶段网络、所述第一阶段网络、所述第二阶段网络、第三阶段网络和第四阶段网络串行连接组成;在所述残差神经网络的所述第二阶段网络和所述第三阶段网络之间插入第二分片注意力网络,其中,所述第二分片注意力网络具有N个分片注意力分支;在所述残差神经网络的所述第三阶段网络和所述第四阶段网络之间插入第三分片注意力网络,其中,所述第三分片注意力网络具有M个分片注意力分支,K、N和M依次增大;将插入三个分片注意力网络后的残差神经网络的作为目标追踪模型,对所述目标追踪模型进行训练。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:所述第一分片注意力网络依次由分片层、K个分片注意力分支、拼接层和注意力层串行连接组成,其中,K个分片注意力分支是彼此并行的,所述第一分片注意力网络中的注意力层与所述第一分片注意力网络中的拼接层和所述第一阶段网络均存在连接;所述第二分片注意力网络依次由分片层、N个分片注意力分支、拼接层和注意力层组成,其中,N个分片注意力分支是彼此并行的,所述第二分片注意力网络中的注意力层与所述第二分片注意力网络中的拼接层和所述第二阶段网络均存在连接;所述第三分片注意力网络依次由分片层、M个分片注意力分支、拼接层和注意力层串行连接组成,其中,M个分片注意力分支是彼此并行的,所述第三分片注意力网络中的注意力层与所述第三分片注意力网络中的拼接层和所述第三阶段网络均存在连接;每个分片注意力分支依次由全局平均池化层、卷积层和激活层串行连接组成。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:在所述第一分片注意力网络中:所述分片层用于将所述第一阶段网络输出的特征图均分为K个小特征图,每个分片注意力分支输入一个小特征图,所述拼接层用于将K个分片注意力分支输出的分支特征图拼接到一起,所述注意力层用于基于所述拼接层的输出对所述第一阶段网络输出的特征图中的每个元素分配注意力;在所述第二分片注意力网络中:所述分片层用于将所述第二阶段网络输出的特征图均分为N个小特征图,每个分片注意力分支输入一个小特征图,所述拼接层用于将N个分片注意力分支输出的分支特征图拼接到一起,所述注意力层用于基于拼接层的输出对所述第二阶段网络输出的特征图中的每个元素分配注意力;在所述第三分片注意力网络中:所述分片层用于将所述第三阶段网络输出的特征图均分为M个小特征图,每个分片注意力分支输入一个小特征图,所述拼接层用于将M个分片注意力分支输出的分支特征图拼接到一起,所述注意力层用于基于拼接层的输出对所述第三阶段网络输出的特征图中的每个元素分配注意力。4.根据权利要求1所述的方法,其特征在于,对所述目标追踪模型进行训练,包括:获取训练数据集,将所述训练数据集中的训练样本输入所述目标追踪模型:通过所述第一阶段网络输出第一阶段特征图,通过所述第一分片注意力网络对所述第一阶段特征图进行处理,得到第一注意力特征图;
通过所述第二阶段网络对第一注意力特征图进行处理,得到第二阶段特征图,通过所述第二分片注意力网络对所述第二阶段特征图进行处理,得到第二注意力特征图;通过所述第三阶段网络对第二注意力特征图进行处理,得到第三阶段特征图,通过所述第三分片注意力网络对所...

【专利技术属性】
技术研发人员:蒋召
申请(专利权)人:深圳须弥云图空间科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1