【技术实现步骤摘要】
本说明书涉及计算机和人工智能领域,尤其涉及一种模型部署的方法、装置、存储介质及电子设备。
技术介绍
1、随着人工智能的不断发展,人工智能模型目前已经应用在诸多领域中,如信息推荐、个人信息及数据的保护,智能驾驶等,而随着人工智能的性能的不断提升以及人工智能算法的不断优化,人工智能模型在各领域中的应用效果也将不断增强。
2、对于目前的诸多业务场景来说,通常需要人工智能模型能够快速响应,并且给出较为精准的输出结果,但是,如何能够兼顾人工智能模型的运行速度以及人工智能模型输出结果的准确性,则是目前一个亟待解决的技术难题。
技术实现思路
1、本说明书实施例提供一种模型部署的方法、装置、存储介质及电子设备,以部分解决上述现有技术存在的问题。
2、本说明书实施例采用下述技术方案:
3、本说明书提供的一种模型部署的方法,包括:
4、目标设备获取待调整模型的模型参数,并根据所述模型参数在本地部署所述待调整模型;
5、接收针对所述待调整模型的调整指令
...【技术保护点】
1.一种模型部署的方法,包括:
2.如权利要求1所述的方法,选取部分网络层,作为各待调整层,具体包括:
3.如权利要求1所述的方法,根据每个待调整层对应的参数精度选项,确定各候选调整策略,具体包括:
4.如权利要求1所述的方法,选取部分网络层,作为各待调整层,具体包括:
5.一种模型部署装置,包括:
6.如权利要求5所述的装置,所述选取模块具体用于,针对每个网络层,根据该网络层的输入数据的维度数和/或该网络层的输出数据的维度数,确定该网络层对所述待调整模型的输出结果的影响程度;根据每个网络层对所述待调整模型的
...【技术特征摘要】
1.一种模型部署的方法,包括:
2.如权利要求1所述的方法,选取部分网络层,作为各待调整层,具体包括:
3.如权利要求1所述的方法,根据每个待调整层对应的参数精度选项,确定各候选调整策略,具体包括:
4.如权利要求1所述的方法,选取部分网络层,作为各待调整层,具体包括:
5.一种模型部署装置,包括:
6.如权利要求5所述的装置,所述选取模块具体用于,针对每个网络层,根据该网络层的输入数据的维度数和/或该网络层的输出数据的维度数,确定该网络层对所述待调整模型的输出结果的影响程度;根据每个网络层对所述待调整模型的输出结果的影响程度,从各网络层中选择部分网络层,作为各待调整层。
7.如权利要求5所述的装置,所述第一确定模块具体用于,根据每个待调整层对应的参数精度选项,确定各初始调整策略;针对每个初始调整策略,根据...
【专利技术属性】
技术研发人员:唐董琦,李若愚,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。