一种模型优化方法、装置、设备及存储介质、程序产品制造方法及图纸

技术编号:33481405 阅读:24 留言:0更新日期:2022-05-19 00:55
本申请提供了一种模型优化方法、装置、设备及存储介质、程序产品;本申请实施例可以应用于云技术、人工智能、智慧交通、车载等各种场景,涉及人工智能技术;该方法包括:获取待优化模型和控制参数;通过对待优化模型中的模型算子进行封装,确定待优化模型对应的超模型;其中,超模型的空间结构是动态变化的;依据模型算子和控制参数,确定待优化模型对应的配置搜索空间;模型算子至少包括:待优化模型中的一个网络层;基于配置搜索空间和所述待优化模型,对超模型进行训练,得到待优化模型对应的收敛超模型;从收敛超模型中搜索得到待优化模型对应的优化模型。通过本申请,能够减少模型优化时计算资源的消耗。优化时计算资源的消耗。优化时计算资源的消耗。

【技术实现步骤摘要】
一种模型优化方法、装置、设备及存储介质、程序产品


[0001]本申请涉及人工智能技术,尤其涉及一种模型优化方法、装置、设备及存储介质、程序产品。

技术介绍

[0002]深度学习模型由于其优秀的特征提取、特征泛化能力,经常作为人工智能的核心支撑技术,被应用到各种场景中。为了使得深度学习模型能够具有更好的预测效果或预测效率,通常都会对训练好的深度学习模型进行模型优化,然后再将优化后的深度学习模型部署到应用场景中。然而,相关技术中,模型优化时的可选模型的在生成时需要消耗巨大的计算资源,从而导致模型优化过程存在计算资源消耗大的问题。

技术实现思路

[0003]本申请实施例提供一种模型优化方法、装置、设备及计算机可读存储介质、程序产品,能够减少模型优化时计算资源的消耗。
[0004]本申请实施例的技术方案是这样实现的:
[0005]本申请实施例提供一种模型优化方法,包括:
[0006]获取待优化模型和控制参数;所述待优化模型是经过训练的模型;
[0007]通过对所述待优化模型中的模型算子进行封装,确定所述待本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种模型优化方法,其特征在于,所述模型优化方法包括:获取待优化模型和控制参数;所述待优化模型是经过训练的模型;通过对所述待优化模型中的模型算子进行封装,确定所述待优化模型对应的超模型;其中,所述超模型的空间结构是动态变化的;依据所述模型算子和所述控制参数,确定所述待优化模型对应的配置搜索空间;所述模型算子至少包括:所述待优化模型中的一个网络层;基于所述配置搜索空间和所述待优化模型,对所述超模型进行训练,得到所述待优化模型对应的收敛超模型;从所述收敛超模型中搜索得到所述待优化模型对应的优化模型。2.根据权利要求1所述的方法,其特征在于,所述通过对所述待优化模型中的模型算子进行封装,确定所述待优化模型对应的超模型,包括:依据所述待优化模型中的模型算子之间的连接关系,将所述待优化模型的所述模型算子划分为多个算子集合;针对每个所述算子集合,确定对应的封装变量;利用所述封装变量对每个所述算子集合中的模型算子进行封装,得到每个所述算子集合的所述模型算子所对应的封装算子;所述封装算子的空间结构是动态的;将利用所述封装算子拼接得到的模型,确定为所述待优化模型对应的所述超模型。3.根据权利要求2所述的方法,其特征在于,所述依据所述待优化模型中的模型算子之间的连接关系,将所述待优化模型的所述模型算子划分为多个算子集合,包括:依据所述待优化模型中的模型算子之间的连接关系,确定所述模型算子对应的输出算子;所述输出算子的输入数据是所述模型算子的输出数据;利用所述输出算子,将所述待优化模型的所述模型算子划分为多个所述算子集合;其中,同一个所述算子集合中的模型算子存在相同的输出算子。4.根据权利要求2所述的方法,其特征在于,所述利用所述封装变量对每个所述算子集合中的模型算子进行封装,得到每个所述算子集合的所述模型算子所对应的封装算子,包括:将所述封装变量与每个所述算子集合中的模型算子的输出通道数进行融合,得到每个所述算子集合的所述模型算子所对应的封装算子。5.根据权利要求2至4任一项所述的方法,其特征在于,所述获取待优化模型和控制参数之后,所述通过对所述待优化模型中的模型算子进行封装,确定所述待优化模型对应的超模型之前,所述方法还包括:从所述待优化模型中,解析得到所述待优化模型的卷积层,以及所述卷积层对应的附属网络层;其中,所述附属网络层至少包括:池化层和激活层;将所述卷积层和所述卷积层所对应的附属网络层,合并为所述待优化模型的所述模型算子。6.根据权利要求1至4任一项所述的方法,其特征在于,所述控制参数包括:多个子模型配置参数;所述依据所述模型算子和所述控制参数,确定所述待优化模型对应的配置搜索空间,包括:利用多个所述子模型配置参数,对每个所述模型算子的空间结构参数分别进行调整,
得到每个所述模型算子对应的多个更新结构参数;将利用每个所述模型算子对应的多个所述更新结构参数所构成的搜索空间,确定为所述待优化模型对应的所述配置搜索空间。7.根据权利要求1至4任一项所述的方法,其特征在于,所述基于所述配置搜索空间和所述待优化模型,对所述超模型进行训练,得到所述待优化模型对应的收敛超模型,包括:将所述待优化模型的副本,确定为教师模型;通过迭代i进行以下处理,1≤i≤N,N为迭代总次数:对所述配置搜索空间进行第i次采样,得到第i个模型配置信息;利用第i个所述模型配置信息,从所述超模型中创建出与第i个所述模型配置信息相对应的子模...

【专利技术属性】
技术研发人员:叶志凌孔翰宋应湃
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1