目标追踪模型的训练方法及装置制造方法及图纸

技术编号：39188409 阅读：11 留言：0更新日期：2023-10-27 08:35

本申请提供了一种目标追踪模型的训练方法及装置。该方法包括：在残差神经网络的第一阶段网络和第二阶段网络之间插入第一分片注意力网络，其中，第一分片注意力网络具有K个分片注意力分支；在残差神经网络的第二阶段网络和第三阶段网络之间插入第二分片注意力网络，其中，第二分片注意力网络具有N个分片注意力分支；在残差神经网络的第三阶段网络和第四阶段网络之间插入第三分片注意力网络，其中，第三分片注意力网络具有M个分片注意力分支，K、N和M依次增大；将插入三个分片注意力网络后的残差神经网络的作为目标追踪模型，对目标追踪模型进行训练。模型进行训练。模型进行训练。

全部详细技术资料下载

【技术实现步骤摘要】
目标追踪模型的训练方法及装置

[0001]本申请涉及目标检测
，尤其涉及一种目标追踪模型的训练方法及装置。

技术介绍

[0002]目标追踪（Person re
‑
identification）也称行人再识别，是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术。现有技术也将注意力机制应用到目标追踪模型中，但是现有的注意力机制无法做到和人一样在观察一个对象时逐渐缩小观察区域的，即现有的注意力机制无法实现逐渐缩小注意力区域，以提取到更加有效的特征，这导致目标追踪模型的精度还有待进一步提高。

技术实现思路

[0003]有鉴于此，本申请实施例提供了一种目标追踪模型的训练方法、装置、电子设备及计算机可读存储介质，以解决现有技术中，现有的注意力机制无法像人一样逐渐缩小注意力区域，提取更加有效的特征，导致目标追踪模型的精度有待进一步提高。
[0004]本申请实施例的第一方面，提供了一种目标追踪模型的训练方法，包括：在残差神经网络的第一阶段网络和第二阶段网络之间插入第一分片注意力网络，其中，第一分片注意力网络具有K个分片注意力分支，残差神经网络依次有第零阶段网络、第一阶段网络、第二阶段网络、第三阶段网络和第四阶段网络串行连接组成；在残差神经网络的第二阶段网络和第三阶段网络之间插入第二分片注意力网络，其中，第二分片注意力网络具有N个分片注意力分支；在残差神经网络的第三阶段网络和第四阶段网络之间插入第三分片注意力网络，其中，第三分片注意力网络具有M个分片注意力分支，K、N和M依...

【技术保护点】

【技术特征摘要】
1.一种目标追踪模型的训练方法，其特征在于，包括：在残差神经网络的第一阶段网络和第二阶段网络之间插入第一分片注意力网络，其中，所述第一分片注意力网络具有K个分片注意力分支，所述残差神经网络依次有第零阶段网络、所述第一阶段网络、所述第二阶段网络、第三阶段网络和第四阶段网络串行连接组成；在所述残差神经网络的所述第二阶段网络和所述第三阶段网络之间插入第二分片注意力网络，其中，所述第二分片注意力网络具有N个分片注意力分支；在所述残差神经网络的所述第三阶段网络和所述第四阶段网络之间插入第三分片注意力网络，其中，所述第三分片注意力网络具有M个分片注意力分支，K、N和M依次增大；将插入三个分片注意力网络后的残差神经网络的作为目标追踪模型，对所述目标追踪模型进行训练。2.根据权利要求1所述的方法，其特征在于，所述方法还包括：所述第一分片注意力网络依次由分片层、K个分片注意力分支、拼接层和注意力层串行连接组成，其中，K个分片注意力分支是彼此并行的，所述第一分片注意力网络中的注意力层与所述第一分片注意力网络中的拼接层和所述第一阶段网络均存在连接；所述第二分片注意力网络依次由分片层、N个分片注意力分支、拼接层和注意力层组成，其中，N个分片注意力分支是彼此并行的，所述第二分片注意力网络中的注意力层与所述第二分片注意力网络中的拼接层和所述第二阶段网络均存在连接；所述第三分片注意力网络依次由分片层、M个分片注意力分支、拼接层和注意力层串行连接组成，其中，M个分片注意力分支是彼此并行的，所述第三分片注意力网络中的注意力层与所述第三分片注意力网络中的拼接层和所述第三阶段网络均存在连接；每个分片注意力分支依次由全局平均池化层、卷积层和激活层串行连接组成。3.根据权利要求2所述的方法，其特征在于，所述方法还包括：在所述第一分片注意力网络中：所述分片层用于将所述第一阶段网络输出的特征图均分为K个小特征图，每个分片注意力分支输入一个小特征图，所述拼接层用于将K个分片注意力分支输出的分支特征图拼接到一起，所述注意力层用于基于所述拼接层的输出对所述第一阶段网络输出的特征图中的每个元素分配注意力；在所述第二分片注意力网络中：所述分片层用于将所述第二阶段网络输出的特征图均分为N个小特征图，每个分片注意力分支输入一个小特征图，所述拼接层用于将N个分片注意力分支输出的分支特征图拼接到一起，所述注意力层用于基于拼接层的输出对所述第二阶段网络输出的特征图中的每个元素分配注意力；在所述第三分片注意力网络中：所述分片层用于将所述第三阶段网络输出的特征图均分为M个小特征图，每个分片注意力分支输入一个小特征图，所述拼接层用于将M个分片注意力分支输出的分支特征图拼接到一起，所述注意力层用于基于拼接层的输出对所述第三阶段网络输出的特征图中的每个元素分配注意力。4.根据权利要求1所述的方法，其特征在于，对所述目标追踪模型进行训练，包括：获取训练数据集，将所述训练数据集中的训练样本输入所述目标追踪模型：通过所述第一阶段网络输出第一阶段特征图，通过所述第一分片注意力网络对所述第一阶段特征图进行处理，得到第一注意力特征图；
通过所述第二阶段网络对第一注意力特征图进行处理，得到第二阶段特征图，通过所述第二分片注意力网络对所述第二阶段特征图进行处理，得到第二注意力特征图；通过所述第三阶段网络对第二注意力特征图进行处理，得到第三阶段特征图，通过所述第三分片注意力网络对所...

【专利技术属性】
技术研发人员：蒋召，
申请(专利权)人：深圳须弥云图空间科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人