System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种目标关联模型的训练方法、装置、设备及介质制造方法及图纸_技高网

一种目标关联模型的训练方法、装置、设备及介质制造方法及图纸

技术编号:41306562 阅读:4 留言:0更新日期:2024-05-13 14:51
本申请涉及图像处理技术领域,尤其涉及一种目标关联模型的训练方法、装置、设备及介质。将样本图像输入到第一特征提取层,得到第一特征矩阵并输入到解码层,解码层基于至少一个待查询目标的第二特征矩阵、第一特征矩阵和第一注意力机制,确定每个待查询目标的目标特征矩阵并输入到全连接层,全连接层对每个目标特征矩阵进行第一分类处理,确定样本图像包括每个待查询目标分别对应的预测概率;根据每个预测概率、样本图像对应的第一标签及待查询目标的数量,确定第一损失值,从而基于第一损失值进行模型训练,使用一个模型便可确定样本图像中是否包括待查询目标,提高了模型训练的效率,且目标关联模型为端到端模型的模型,降低了系统的复杂度。

【技术实现步骤摘要】

本申请涉及图像处理,尤其涉及一种目标关联模型的训练方法、装置、设备及介质


技术介绍

1、目标关联是将不同信息源的同一目标进行关联的技术,广泛存在于目标跟踪和目标检索领域,可用于智能安防、视频监控等场景中。目标关联即给定目标的图像,完成不同相机下图像或者视频数据中特定目标的检索。

2、相关技术中,一般采用深度学习网络首先对待查询目标的图像进行特征提取,得到待查询特征,然后对待查询图像序列先进行目标检测,得到待查询图像序列中包括的所有目标,再对检测出的所有目标进行特征提取,得到所有目标的目标特征,最后对待查询特征和所有的目标特征进行对比分析,完成目标关联。上述方式分为目标检测和目标特征提取两个部分,需要单独训练每个部分对应的模型,效率较低。并且,所训练的模型并非端到端模式的模型,增加了系统的复杂度。


技术实现思路

1、本申请实施例提供了一种目标关联模型的训练方法、装置、设备及介质,用以解决现有技术中目标关联效率较低的问题。

2、第一方面,本申请提供了一种目标关联模型的训练方法,目标关联模型的初始模型包括第一特征提取层、解码层和全连接层,所述方法包括:

3、获取训练集,所述训练集中包括样本图像,及每个样本图像对应的第一标签,所述第一标签用于标识对应的样本图像是否包括待查询目标;

4、将任一样本图像输入到所述第一特征提取层,得到第一特征矩阵并输入到所述解码层;所述解码层基于获取到的至少一个待查询目标的第二特征矩阵、所述第一特征矩阵和第一注意力机制,确定每个待查询目标对应的目标特征矩阵并输入到所述全连接层;所述全连接层对每个目标特征矩阵进行第一分类处理,确定所述样本图像包括每个待查询目标分别对应的预测概率;

5、根据每个预测概率、所述样本图像对应的第一标签及待查询目标的数量,确定第一损失值,并基于所述第一损失值,对所述初始模型中的参数进行调整,得到所述目标关联模型。

6、第二方面,本申请还提供了一种目标关联模型的训练装置,目标关联模型的初始模型包括第一特征提取层、解码层和全连接层,所述装置包括:

7、获取模块,用于获取训练集,所述训练集中包括样本图像,及每个样本图像对应的第一标签,所述第一标签用于标识对应的样本图像是否包括待查询目标;

8、预测模块,用于将任一样本图像输入到所述第一特征提取层,得到第一特征矩阵并输入到所述解码层;所述解码层基于获取到的至少一个待查询目标的第二特征矩阵、所述第一特征矩阵和第一注意力机制,确定每个待查询目标对应的目标特征矩阵并输入到所述全连接层;所述全连接层对每个目标特征矩阵进行第一分类处理,确定所述样本图像包括每个待查询目标分别对应的预测概率;

9、训练模块,用于根据每个预测概率、所述样本图像对应的第一标签及待查询目标的数量,确定第一损失值,并基于所述第一损失值,对所述初始模型中的参数进行调整,得到所述目标关联模型。

10、第三方面,本申请还提供了一种电子设备,所述电子设备包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如上述任一所述目标关联模型的训练方法的步骤。

11、第四方面,本申请还提供了一种计算机可读存储介质,其存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一所述目标关联模型的训练方法的步骤。

12、由于在本申请实施例中,将训练集中的任一样本图像输入到初始模型的第一特征提取层,得到第一特征矩阵并输入到解码层,解码层基于获取到的至少一个待查询目标的第二特征矩阵、第一特征矩阵和第一注意力机制,确定每个待查询目标对应的目标特征矩阵并输入到全连接层,全连接层对每个目标特征矩阵进行第一分类处理,确定样本图像包括每个待查询目标分别对应的预测概率;根据每个预测概率、样本图像对应的第一标签及待查询目标的数量,确定第一损失值,并基于第一损失值,对初始模型中的参数进行调整,得到目标关联模型,使用一个模型即可确定样本图像中是否包括待查询目标,提高了模型训练的效率,且训练得到的目标关联模型为端到端模型的模型,降低了系统的复杂度。

本文档来自技高网...

【技术保护点】

1.一种目标关联模型的训练方法,其特征在于,目标关联模型的初始模型包括第一特征提取层、解码层和全连接层,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述初始模型还包括Transformer编码层,所述将任一样本图像输入到所述第一特征提取层,得到第一特征矩阵包括:

3.根据权利要求2所述的方法,其特征在于,所述解码层为Transformer解码层,所述解码层基于获取到的待查询目标的第二特征矩阵、所述第一特征矩阵和第一注意力机制,确定所述待查询目标对应的目标特征矩阵,包括:

4.根据权利要求1或3所述的方法,其特征在于,所述待查询目标的第二特征矩阵的获取过程包括:

5.根据权利要求1所述的方法,其特征在于,所述训练集中还包括每个样本图像对应的第二标签,所述第二标签用于标识待查询目标在对应的样本图像中的标准位置;所述确定第一损失值之后,所述基于所述第一损失值,对所述初始模型中的参数进行调整之前,所述方法还包括:

6.一种目标关联模型的训练装置,其特征在于,目标关联模型的初始模型包括第一特征提取层、解码层和全连接层,所述装置包括:

7.根据权利要求6所述的装置,其特征在于,所述初始模型还包括Transformer编码层,所述预测模块,具体用于获取任一样本图像的位置编码矩阵,并将所述位置编码矩阵和对应的样本图像输入到所述第一特征提取层,所述第一特征提取层基于所述样本图像得到所述第一特征矩阵;将所述第一特征矩阵和所述位置编码矩阵输入到所述Transformer编码层,所述Transformer编码层基于第二注意力机制对所述第一特征矩阵和所述位置编码矩阵进行处理,得到第三特征矩阵;使用所述第三特征矩阵对所述第一特征矩阵进行更新。

8.根据权利要求7所述的装置,其特征在于,所述解码层为Transformer解码层,所述预测模块,具体用于所述Transformer解码层基于所述第二特征矩阵、所述第一特征矩阵、所述位置编码矩阵和第一注意力机制,确定所述待查询目标对应的目标特征矩阵。

9.一种电子设备,其特征在于,所述电子设备包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1-5任一项所述目标关联模型的训练方法的步骤。

10.一种计算机可读存储介质,其特征在于,其存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-5中任一项所述目标关联模型的训练方法的步骤。

...

【技术特征摘要】

1.一种目标关联模型的训练方法,其特征在于,目标关联模型的初始模型包括第一特征提取层、解码层和全连接层,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述初始模型还包括transformer编码层,所述将任一样本图像输入到所述第一特征提取层,得到第一特征矩阵包括:

3.根据权利要求2所述的方法,其特征在于,所述解码层为transformer解码层,所述解码层基于获取到的待查询目标的第二特征矩阵、所述第一特征矩阵和第一注意力机制,确定所述待查询目标对应的目标特征矩阵,包括:

4.根据权利要求1或3所述的方法,其特征在于,所述待查询目标的第二特征矩阵的获取过程包括:

5.根据权利要求1所述的方法,其特征在于,所述训练集中还包括每个样本图像对应的第二标签,所述第二标签用于标识待查询目标在对应的样本图像中的标准位置;所述确定第一损失值之后,所述基于所述第一损失值,对所述初始模型中的参数进行调整之前,所述方法还包括:

6.一种目标关联模型的训练装置,其特征在于,目标关联模型的初始模型包括第一特征提取层、解码层和全连接层,所述装置包括:

7.根据权利要求6所述的装置,其特征在于...

【专利技术属性】
技术研发人员:曹贵保刘畅朱树磊殷俊
申请(专利权)人:浙江大华技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1