一种模型部署的方法、装置、存储介质及电子设备制造方法及图纸

技术编号:40501633 阅读:25 留言:0更新日期:2024-02-26 19:29
本说明书公开了一种模型部署的方法、装置、存储介质及电子设备,在此方法中,目标设备对待调整模型进行多轮调整时,每一轮调整均会从待调整模型所包含网络层中,进行各待调整层的选取,并会根据使用调整策略后的调整后模型的预设运行时长以及调整后模型的预期的输出结果的精确度,来对初始调整策略进行筛选,以得到符合本轮调整的最佳调整策略,每一轮调整均会在上一轮调整后的调整策略进行,以此进行调整策略的逐步优化,并通过最后一轮调整从中确定目标策略,来对待调整模型进行调整,得到目标模型,并对其进行部署。这样一来,在一定程度上减少模型运行时的计算量,并在保证待调整模型输出准确度的前提下,提高运行效率并减少存储资源浪费。

【技术实现步骤摘要】

本说明书涉及计算机和人工智能领域,尤其涉及一种模型部署的方法、装置、存储介质及电子设备


技术介绍

1、随着人工智能的不断发展,人工智能模型目前已经应用在诸多领域中,如信息推荐、个人信息及数据的保护,智能驾驶等,而随着人工智能的性能的不断提升以及人工智能算法的不断优化,人工智能模型在各领域中的应用效果也将不断增强。

2、对于目前的诸多业务场景来说,通常需要人工智能模型能够快速响应,并且给出较为精准的输出结果,但是,如何能够兼顾人工智能模型的运行速度以及人工智能模型输出结果的准确性,则是目前一个亟待解决的技术难题。


技术实现思路

1、本说明书实施例提供一种模型部署的方法、装置、存储介质及电子设备,以部分解决上述现有技术存在的问题。

2、本说明书实施例采用下述技术方案:

3、本说明书提供的一种模型部署的方法,包括:

4、目标设备获取待调整模型的模型参数,并根据所述模型参数在本地部署所述待调整模型;

5、接收针对所述待调整模型的调整指令,以根据所述调整指令本文档来自技高网...

【技术保护点】

1.一种模型部署的方法,包括:

2.如权利要求1所述的方法,选取部分网络层,作为各待调整层,具体包括:

3.如权利要求1所述的方法,根据每个待调整层对应的参数精度选项,确定各候选调整策略,具体包括:

4.如权利要求1所述的方法,选取部分网络层,作为各待调整层,具体包括:

5.一种模型部署装置,包括:

6.如权利要求5所述的装置,所述选取模块具体用于,针对每个网络层,根据该网络层的输入数据的维度数和/或该网络层的输出数据的维度数,确定该网络层对所述待调整模型的输出结果的影响程度;根据每个网络层对所述待调整模型的输出结果的影响程度,...

【技术特征摘要】

1.一种模型部署的方法,包括:

2.如权利要求1所述的方法,选取部分网络层,作为各待调整层,具体包括:

3.如权利要求1所述的方法,根据每个待调整层对应的参数精度选项,确定各候选调整策略,具体包括:

4.如权利要求1所述的方法,选取部分网络层,作为各待调整层,具体包括:

5.一种模型部署装置,包括:

6.如权利要求5所述的装置,所述选取模块具体用于,针对每个网络层,根据该网络层的输入数据的维度数和/或该网络层的输出数据的维度数,确定该网络层对所述待调整模型的输出结果的影响程度;根据每个网络层对所述待调整模型的输出结果的影响程度,从各网络层中选择部分网络层,作为各待调整层。

7.如权利要求5所述的装置,所述第一确定模块具体用于,根据每个待调整层对应的参数精度选项,确定各初始调整策略;针对每个初始调整策略,根据...

【专利技术属性】
技术研发人员:唐董琦李若愚
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1