模型训练方法、电子设备及存储介质技术

技术编号：33616642 阅读：16 留言：0更新日期：2022-06-02 00:31

本申请涉及机器学习技术领域，具体公开了一种模型的训练方法、电子设备及存储介质，所述方法包括：获取预先训练好的超网络模型；从所述超网络模型的预设数量的子网络模型中，确定多个目标子网络模型；获取多个基于开源数据训练的主流网络模型；将每个所述目标子网络模型作为第一主干网络与第一分支网络拼接，得到多个第一拼接网络，以及将每个所述主流网络模型作为第二主干网络与第二分支网络拼接得到多个第二拼接网络；对多个所述第一拼接网络和所述第二拼接网络进行微调并测试以确定目标网络模型；对所述目标网络模型进行迁移学习，得到需要的模型，进而实现模型训练的便捷化和智能化，提升用户的体验度。提升用户的体验度。提升用户的体验度。

全部详细技术资料下载

【技术实现步骤摘要】
模型训练方法、电子设备及存储介质

[0001]本申请涉及机器学习
，尤其涉及一种模型的训练方法、电子设备及存储介质。

技术介绍

[0002]神经网络结构搜索(Neural Architecture Search，NAS)是自动机器学习(Automated Machine Learning，AutoML)领域热点之一，通过设计经济高效的搜索方法，可以自动获取泛化能力强，硬件要求友好的神经网络，因此可以节省大量人力物力。NAS的主要工作原理是先定义搜索空间，然后通过搜索策略找出候选网络结构，对它们进行评估，根据反馈进行下一轮的搜索，直至搜索到目标网络结构，并基于目标网络结构进行自动机器学习得到需要的模型。
[0003]但是，现有的NAS搜索过程较长，每次拿到用户数据之后，都需要从头搜索，得到网络结构，使用该网络结构时候还需要进行预训练，然后在用户数据上进行迁移学习，才能得到需要的模型。由于需要长时间搜索等待，因此无法给用户提供友好的体验。

技术实现思路

[0004]本申请实施例提供了一种模型的训练方法、电子设备及存储介质，旨在解决长时间的神经网络结构搜索等待的问题，节约了时间成本，提供给用户更友好的体验。
[0005]第一方面，本申请提供了一种模型的训练方法，所述方法包括：
[0006]获取预先训练好的超网络模型，所述超网络模型包括预设数量的子网络模型；
[0007]从所述超网络模型的预设数量的子网络模型中，确定多个目标子网络模型；
[0008]获取多个基于开...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法，其特征在于，所述方法包括：获取预先训练好的超网络模型，所述超网络模型包括预设数量的子网络模型；从所述超网络模型的预设数量的子网络模型中，确定多个目标子网络模型；获取多个基于开源数据训练的主流网络模型；将每个所述目标子网络模型作为第一主干网络，与第一分支网络拼接，得到多个第一拼接网络，以及将每个所述主流网络模型作为第二主干网络，与第二分支网络拼接，得到多个第二拼接网络，其中，每个所述第一主干网络后拼接的第一分支网络的网络结构相同且参数共享，每个所述第二主干网络后拼接的第二分支网络的网络结构相同且参数不共享；对多个所述第一拼接网络和所述第二拼接网络进行微调并测试，以确定目标网络模型；对所述目标网络模型进行迁移学习，得到需要的模型。2.根据权利要求1所述的方法，其特征在于，所述方法还包括：获取开源数据集；获取预设的超网络，所述超网络包括第一数量的通道和第二数量的层；随机关断所述超网络的通道和/或层，并利用所述开源数据集对剩下的网络训练一批数据；重复执行所述随机关断所述预设的超网络的通道和/或层，并利用所述开源数据集对剩下的网络训练一批数据的步骤，直至所述超网络收敛，得到预先训练好的超网络模型。3.根据权利要求1所述的方法，其特征在于，所述从所述超网络模型的预设数量的子网络模型中，确定多个目标子网络模型，包括：基于预设采样算法，从所述超网络模型中选取满足预设模型约束条件的子网络模型，直至采集的子网络模型的数量满足预设值为止；对采集到的多个子网络模型进行测试评估，确定多个目标子网络模型。4.根据权利要求3所述的方法，其特征在于，所述基于预设采样算法，从所述超网络模型中选取满足预设模型约束条件的子网络模型，包括：随机从所述超网络模型选取一个子网络模型；确定所述子网络模型的运算量是否小于预设运算量阈值，以及所述子网络模型的模型参数量是否小于预设参数量阈值；若所述子网络模型的运算量小于所述预设运算量阈值，且所述子网络模型的模型参数量小于所述预设参数量阈值，则选定所述子网络模型。5.根据权利要求1所述的方法，其特征在于，所述对采集到的多个子网络模型进行测试评估，确定多个目标子网络模型，包括：根据主流网络模型的数量确定需要确定的目标子网络模型的数量；根据测试集对所述采集到的多个子网络模型进行测试，得到所述多个子网络模型的准确率；根据所述多个子网络模型的准确率对所述多个子网络模型进行排序，得到所述多个子网络模型的排序结果；以及根据所述排序结果和所述目标子网络模型的数量，确定多个目标子网络模型。6.根据权利要求1所述的方法，其特征在于，所述获取多个...

【专利技术属性】
技术研发人员：蒋阳，豆泽阳，庞磊，赵丛，
申请(专利权)人：共达地创新技术深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人