【技术实现步骤摘要】
一种向终端设备部署模型的方法、装置和设备
[0001]本文件涉及计算机
,尤其涉及一种向终端设备部署模型的方法、装置和设备。
技术介绍
[0002]随着经济技术的发展,终端设备越来越普及且越来越多样化,比如手机,几乎人手一部且种类繁多。并且,随着智能操作系统的日渐成熟,使得在不同终端设备上部署AI模型(以下简称模型)成为可能。
[0003]目前,虽然绝大部分终端设备都具有模型运行和计算能力,但是不同终端设备的算力存在优劣之分,这导致模型在不同终端设备上的运行和计算能力存在不公平和歧视的问题,导致用户体验不一致,比如,同样的模型,在算力好的手机上运行速度快,用户体验较好,而在算力相对较差的手机上运行速度比较慢,甚至还会出现闪退,不仅用户体验很差,而且会导致用户需要办理的一些业务无法顺利进行。
技术实现思路
[0004]本说明书实施例提供了一种向终端设备部署模型的方法、装置和设备,以解决相关技术中将模型在部署在不同终端设备上存在不公平和歧视性问题,以及由此所带来的用户体验不一致的问题。
[0005]为解决上述技术问题,本说明书实施例是这样实现的:
[0006]第一方面,提出了一种向终端设备部署模型的方法,包括:
[0007]基于神经架构搜索NAS训练出大小不同的若干模型,所述若干模型的功能一致;
[0008]基于不同终端设备的算力表征参数,从所述若干模型中筛选出与不同终端设备的算力匹配的模型,其中,为不同终端设备筛选的模型在各自终端设备上的预设运行参数一致,所 ...
【技术保护点】
【技术特征摘要】
1.一种向终端设备部署模型的方法,包括:基于神经架构搜索NAS训练出大小不同的若干模型,所述若干模型的功能一致;基于不同终端设备的算力表征参数,从所述若干模型中筛选出与不同终端设备的算力匹配的模型,其中,为不同终端设备筛选的模型在各自终端设备上的预设运行参数一致,所述预设运行参数包括运行时间和能量消耗中的至少一项;将与不同终端设备的算力匹配的模型部署至相应的终端设备。2.根据权利要求1所述的方法,所述基于NAS训练出大小不同的若干模型,包括:基于one
‑
shot NAS训练出大小不同的若干模型。3.根据权利要求2所述的方法,所述基于one
‑
shot NAS训练出大小不同的若干模型,包括:构建超网络,其中,所述超网络中包含若干子网络,一个子网络为一个模型;循环执行指定步骤直到所述若干子网络收敛,得到大小不同的若干模型;其中,所述指定步骤包括:从所述超网络中采样多个子网络;基于训练集对所述多个子网络进行训练。4.根据权利要求3所述的方法,在基于训练集对采样得到的子网络进行训练过程中,对子网络中同一层的卷积核进行参数共享。5.根据权利要求4所述的方法,所述对子网络中同一层的卷积核进行参数共享,包括:从子网络中同一层的大尺寸的卷积核中获取小尺寸的卷积核,使得小尺寸的卷积核为大尺寸的卷积核的一部分。6.根据权利要求2
‑
5任一项所述的方法,所述从所述超网络中采样多个子网络,包括:基于预设采样规则从所述超网络中采样多个子网络,其中,所述预设采样规则是根据子网络中层的参数量和层的深度确定的,所述预设采样规则用于保证尺寸大的子网络被采样的概率大于尺寸小的子网络被采样的概率。7.根据权利要求6所述的方法,所述预设采样规则包括:基于均匀分布从所述超网络中初步采样n个子网络;对所述n个子网络中的任一子网络,分别基于该子网络各层的深度和各层中的参数量中的至少一项,确定该子网络的采样因子;按采样因子的大小对所述n个子网络进行降序排序;将排序在前的m个子网络作为最终采样的多个子网络。8.根据权利要求7所述的方法,所述基于该子网络各层的深度和各层中的参数量中的至少一项,确定该子网络的采样因子,包括:基于下述公式确定子网络的采样因子:λ
i
=∑
i
α
j
·
p
ij
其中,λ
i
表示第i个子网络的采样因子,α
j
表示第i个子网络的第j个层的深度对收敛的影响,越靠近输出层α
j
越小,p
ij
表示第i个子网络的第j个层中的参数量。9.根据权利要求2
...
【专利技术属性】
技术研发人员:张长浩,申书恒,傅欣艺,王维强,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。