模型间的特征兼容学习方法、装置、电子设备及介质制造方法及图纸

技术编号：30681996 阅读：31 留言：0更新日期：2021-11-06 09:12

本申请提供一种模型间的特征兼容学习方法、装置、电子设备及介质。所述方法包括：根据第一模型确定的模型参数和第二模型待学习的模型参数以及新训练数据集，确定第一模型和第二模型的特征兼容学习信息，所述特征兼容学习信息包括代表特征迁移损失和/或网络组件的结构正则，所述新训练数据集用于第二模型训练；将所述特征兼容学习信息以及用于监督第二模型的目标损失共同作为第二模型最终的优化目标，以完成第一模型和第二模型间的特征兼容学习，通过本方案，能够获得一个兼容的特征，使得其可以与旧版本模型提取的特征直接进行匹配检索，旧版本模型被更新后，整个数据库的特征无需被重新提取，节约了时间，减少了计算资源消耗。消耗。消耗。

全部详细技术资料下载

【技术实现步骤摘要】
模型间的特征兼容学习方法、装置、电子设备及介质

[0001]本申请涉及人工智能
，具体涉及一种模型间的特征兼容学习方法及装置、一种电子设备以及一种计算机可读存储介质。

技术介绍

[0002]在目标再识别系统中，为了取得更高的性能，部署的模型需要被频繁的更新。新模型可能训练自更大的数据集，使用更先进的网络架构或损失函数。一旦模型被更新，整个数据库的特征需要被重新提取，以保证特征的兼容性。因为数据库中包含百万甚至千万级别图像，特征重提取十分消耗时间和计算资源。此外，在实际的应用系统中，计算资源十分有限，用户往往没有临时的可以被大量使用的GPU资源。

技术实现思路

[0003]本申请的目的是提供一种模型间的特征兼容学习方法及装置、一种电子设备以及一种计算机可读存储介质。
[0004]本申请第一方面提供一种模型间的特征兼容学习方法，包括：
[0005]根据第一模型确定的模型参数和第二模型待学习的模型参数以及新训练数据集，确定第一模型和第二模型的特征兼容学习信息，所述特征兼容学习信息包括代表特征迁移损失和/或网络组件的结构正则，所述新训练数据集用于第二模型训练；
[0006]将所述特征兼容学习信息以及用于监督第二模型的目标损失共同作为第二模型最终的优化目标，以完成第一模型和第二模型间的特征兼容学习。
[0007]本申请第二方面提供一种模型间的特征兼容学习装置，包括：
[0008]确定模块，用于根据第一模型确定的模型参数和第二模型待学习的模型参数以及新训练数据集，确定...

【技术保护点】

【技术特征摘要】
1.一种模型间的特征兼容学习方法，其特征在于，包括：根据第一模型确定的模型参数和第二模型待学习的模型参数以及新训练数据集，确定第一模型和第二模型的特征兼容学习信息，所述特征兼容学习信息包括代表特征迁移损失和/或网络组件的结构正则，所述新训练数据集用于第二模型训练；将所述特征兼容学习信息以及用于监督第二模型的目标损失共同作为第二模型最终的优化目标，以完成第一模型和第二模型间的特征兼容学习。2.根据权利要求1所述的方法，其特征在于，所述确定第一模型和第二模型的代表特征迁移损失，包括：使用第一模型提取新训练数据集中所有样本的特征，得到第一模型特征；基于第一模型特征，提取第一模型对应的每个类别的代表特征；使用第二模型提取新训练数据集中所有样本的特征，得到第二模型特征，对于每个第二模型特征，计算其与各所述代表特征的相似度；计算基于所述相似度的代表特征迁移损失，以实现第一模型和第二模型的特征兼容；所述代表特征迁移损失的表达式如下：其中，为第二模型参数，M
o
为第一模型代表特征的集合，T
N
为新训练数据集，符号<.，.>代表样本特征的余弦距离，x
c
为类别标签为c的样本，为c类别的代表特征。3.根据权利要求1或2所述的方法，其特征在于，所述第一模型的网络组件包括第一特征提取模块和第一任务头模块；所述第二模型的网络组件包括第二特征提取模块和第二任务头模块。4.根据权利要求3所述的方法，其特征在于，所述确定第一模型和第二模型的网络组件的结构正则，包括：确定第一特征提取模块和第二任务头模块重组后的第一重组网络的第一监督损失；确定第二特征提取模块和第一任务头模块重组后的第二重组网络的第二监督损失；根据第一监督损失和第二监督损失确定第一模型和第二模型相互结构正则化的优化目标；所述优化目标的表达式如下：其中，L
CE_O
为第一监督损失，L
CE_N
为第二监督损失；代表使用第一特征提取模块和第二任务头模块h
N
在数据集T
N
上进行特定的目标任务，T
N
为新训练数据集；代表使用第二特征提取模块和第一任务头模块h
O
在数据集t
N
′
上进行特定的目标任务，t
N
′
为新训练数据集与旧训练数据集中具有相同类别的样本集合，所述旧训练数据集用于第一模型训练。5.一种模型间的特征兼容学习装置，其特征在于，包括：确定模块，用于根据第一模型确定的模型参数和第二模型待学习的模型参数以及新训
练数据集...

【专利技术属性】
技术研发人员：段凌宇，白燕，吴生森，
申请(专利权)人：北京大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人