模型训练方法、装置及电子设备制造方法及图纸

技术编号：29934608 阅读：19 留言：0更新日期：2021-09-04 19:08

本申请公开了模型训练方法、装置及电子设备，涉及计算机视觉、深度学习等人工智能技术领域。具体实现方案为：获取第一神经网络模型，所述第一神经网络模型基于第二神经网络模型进行剪枝得到，所述第一神经网络模型与任务模型的特征提取网络的结构匹配，所述任务模型用于进行图像识别；对所述第一神经网络模型进行训练；基于训练好的第一神经网络模型，对所述任务模型进行训练。根据本申请的技术，解决了模型训练技术中存在的模型训练效果比较差的问题，提高了模型训练的效果。提高了模型训练的效果。提高了模型训练的效果。

全部详细技术资料下载

【技术实现步骤摘要】
模型训练方法、装置及电子设备

[0001]本申请涉及人工智能
，尤其涉及计算机视觉、深度学习
，具体涉及一种模型训练方法、装置及电子设备。

技术介绍

[0002]随着人工智能的高速发展，基于深度学习的神经网络模型得到了广泛的应用，比如，可以采用神经网络模型进行车辆检测。为了基于神经网络模型实现具体任务如车辆检测任务，需要对神经网络模型进行训练，以使神经网络模型可以学习到图像特征，并基于图像特征进行相应任务的实现。
[0003]目前，神经网络模型的训练方式通常是初始化模型参数，在训练过程中更新初始化的模型参数，直至训练完成。

技术实现思路

[0004]本公开提供了一种模型训练方法、装置及电子设备。
[0005]根据本公开的第一方面，提供了一种模型训练方法，包括：
[0006]获取第一神经网络模型，所述第一神经网络模型基于第二神经网络模型进行剪枝得到，所述第一神经网络模型与任务模型的特征提取网络的结构匹配，所述任务模型用于进行图像识别；
[0007]对所述第一神经网络模型进行训练；
[0008]基于训练好的第一神经网络模型，对所述任务模型进行训练。
[0009]根据本公开的第二方面，提供了一种模型训练装置，包括：
[0010]获取模块，用于获取第一神经网络模型，所述第一神经网络模型基于第二神经网络模型进行剪枝得到，所述第一神经网络模型与任务模型的特征提取网络的结构匹配，所述任务模型用于进行图像识别；
[0011]第一训练模块，用于...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法，包括：获取第一神经网络模型，所述第一神经网络模型基于第二神经网络模型进行剪枝得到，所述第一神经网络模型与任务模型的特征提取网络的结构匹配，所述任务模型用于进行图像识别；对所述第一神经网络模型进行训练；基于训练好的第一神经网络模型，对所述任务模型进行训练。2.根据权利要求1所述的方法，其中，所述对所述第一神经网络模型进行训练，包括：获取第一训练样本图像；将所述第一训练样本图像输入至所述第一神经网络模型执行第一操作，得到所述第一训练样本图像的监督信息，所述第一操作用于基于所述第一神经网络模型对所述第一训练样本图像进行自监督学习处理；基于所述监督信息更新所述第一神经网络模型的模型参数。3.根据权利要求2所述的方法，其中，所述第一神经网络模型的网络分支包括第一网络分支和第二网络分支，所述将所述第一训练样本图像输入至所述第一神经网络模型执行第一操作，得到所述第一训练样本图像的监督信息，包括：对所述第一训练样本图像进行数据增强，得到第一图像和第二图像；基于所述第一网络分支对所述第一图像进行特征提取，得到第一特征；基于所述第二网络分支对所述第二图像进行特征提取，得到第二特征；对所述第一特征和所述第二特征进行特征比对，得到所述第一训练样本图像的监督信息。4.根据权利要求3所述的方法，其中，所述第一神经网络模型的模型参数包括所述第一网络分支的第一模型参数，所述基于训练好的第一神经网络模型，对所述任务模型进行训练，包括：获取第二训练样本图像；将所述第二训练样本图像输入至所述任务模型执行第二操作，得到所述第二训练样本图像的识别结果；基于所述识别结果，更新所述任务模型的第二模型参数；其中，所述第二操作包括：将所述第一模型参数作为所述任务模型的特征提取网络的参数，对所述第二训练样本图像进行特征提取，得到第三特征；基于所述第三特征进行图像识别，得到所述识别结果。5.根据权利要求3所述的方法，其中，所述第二神经网络模型的网络分支包括第三网络分支，所述获取第一神经网络模型，包括：将所述第三网络分支中目标网络的卷积层的通道数进行缩减，得到所述第一网络分支；其中，所述目标网络为所述第三网络分支中，网络深度大于其他网络的网络。6.一种模型训练装置，包括：获取模块，用于获取第一神经网络模型，所述第一神经网络模型基于第二神经网络模型进行剪枝得到，所述第一神经网络模型与任务模型的特征提取网络的结构匹配，所述任务模型用于进行图像识别；
第一训练模块，用于对所述第一神经网络模型进行训练；第二训练模块，用于基于训练好...

【专利技术属性】
技术研发人员：张为明，张伟，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人