一种模型训练方法、装置、电子设备、介质制造方法及图纸

技术编号:41873329 阅读:14 留言:0更新日期:2024-07-02 00:24
本公开提供一种模型训练方法、装置、电子设备、介质,通过获取目标第一网络模型,目标第一网络模型为通过训练数据集对初始第一网络模型进行训练得到;将训练数据集输入目标第一网络模型,得到每个第一网络层的分类预测结果;获取每个第一网络层的卷积通道特征;使用训练数据集、分类预测结果、卷积通道特征,对初始第二网络模型进行训练,得到目标第二网络模型,初始第二网络模型包括的多个第二网络层与多个第一网络层相对应,初始第二网络模型的参数量小于初始第一网络模型。通过训练第一网络模型,将第一网络模型的输出以及卷积通道特征和第二网络模型的输出作为训练数据进行迭代训练,能够提升第二网络模型的精确度和泛化能力。

【技术实现步骤摘要】

本公开涉及图像处理,尤其涉及一种模型训练方法、装置、电子设备、介质


技术介绍

1、行人重识别也称行人再识别,是利用计算机视觉技术判断图像或者视频序列是否存在特定行人的技术,广泛被认为是图像检索的子问题。给定一个监控行人图像,检索跨设备下的该行人图像,旨在弥补固定的摄像头的视觉局限,并可与行人检测/行人跟踪技术相结合,可广泛应用于智能视频监控、智能安保等领域。将深度神经网络用于行人重识别,在训练阶段不仅需要大量的参数,也需要消耗大量的计算和内存资源,使得在资源有限的移动设备或嵌入式系统上部署深度学习模型变得非常困难,增加了模型训练复杂度、运行时间和存储成本。知识蒸馏方法可以实现模型的压缩,目前的知识蒸馏方法通常采用教师网络最后一层的知识进行蒸馏,且为教师向学生网络的单向知识传递的方式训练。


技术实现思路

1、为了解决相关技术中存在的问题,本公开提出一种模型训练方法,通过融合多阶段学习和自我学习的模型蒸馏方法训练获得的行人重识别模型,通过知识蒸馏的方式减少了行人重识别模型的复杂度,从而提升了行人重识别模型的运行本文档来自技高网...

【技术保护点】

1.一种模型训练方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述将所述训练数据集输入所述目标第一网络模型,得到每个第一网络层的分类预测结果包括:

3.根据权利要求2所述的方法,其特征在于,所述使用所述训练数据集、所述分类预测结果、所述卷积通道特征,对初始第二网络模型进行训练包括:

4.根据权利要求3所述的方法,其特征在于,所述对所述初始第二网络模型的每个第二网络层进行迭代训练,还包括:

5.根据权利要求3所述的方法,其特征在于,所述根据每个第一网络层的分类预测结果、每个第二网络层的分类预测结果、所述多个分类器的数量,...

【技术特征摘要】

1.一种模型训练方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述将所述训练数据集输入所述目标第一网络模型,得到每个第一网络层的分类预测结果包括:

3.根据权利要求2所述的方法,其特征在于,所述使用所述训练数据集、所述分类预测结果、所述卷积通道特征,对初始第二网络模型进行训练包括:

4.根据权利要求3所述的方法,其特征在于,所述对所述初始第二网络模型的每个第二网络层进行迭代训练,还包括:

5.根据权利要求3所述的方法,其特征在于,所述根据每个第一网络层的分类预测结果、每个第二网络层的分类预测结果...

【专利技术属性】
技术研发人员:熊祥硕
申请(专利权)人:中移苏州软件技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1