【技术实现步骤摘要】
机器学习模型在运行时期间的可变参数相关申请的交叉引用本专利申请要求2019年5月31日提交的名称为“MUTABLEPARAMETERSFORMACHINELEARNINGMODELSDURINGRUNTIME”的美国临时专利申请序列号62/855,898的权益,该临时专利申请据此全文以引用方式并入本文并且构成本美国技术专利申请的部分以用于所有目的。
本说明书整体涉及提供在目标平台上执行的神经网络模型。
技术介绍
软件工程师和科学家一直在使用计算机硬件跨不同行业应用改进机器学习,这些行业包括图像分类、视频分析、语音识别和自然语言处理等。值得注意的是,神经网络正被越来越频繁地使用,以创建能够基于针对大量数据的训练执行不同计算任务的系统。附图说明本主题技术的一些特征在所附权利要求书中被列出。然而,出于解释的目的,在以下附图中阐述了本主题技术的若干实施方案。图1示出了根据一个或多个具体实施的示例网络环境。图2示出了根据一个或多个具体实施的在电子设备上实现的示例软件栈,该软件栈用 ...
【技术保护点】
1.一种方法,包括:/n接收对应于神经网络(NN)模型的代码以及用于所述NN模型的一组权重;/n确定所述NN模型中的一组可变层;/n确定用于将第二组权重映射至用于所述NN模型的所述一组权重的信息;以及/n生成对应于所述一组可变层的元数据,以及用于将所述第二组权重映射至用于所述NN模型的所述一组权重的所述信息,其中所生成的元数据使得在执行所述NN模型期间能够更新所述一组可变层。/n
【技术特征摘要】 【专利技术属性】
20190531 US 62/855,898;20191014 US 16/601,5041.一种方法,包括:
接收对应于神经网络(NN)模型的代码以及用于所述NN模型的一组权重;
确定所述NN模型中的一组可变层;
确定用于将第二组权重映射至用于所述NN模型的所述一组权重的信息;以及
生成对应于所述一组可变层的元数据,以及用于将所述第二组权重映射至用于所述NN模型的所述一组权重的所述信息,其中所生成的元数据使得在执行所述NN模型期间能够更新所述一组可变层。
2.根据权利要求1所述的方法,还包括:
编译所述代码和所生成的元数据以创建所述NN模型的编译二进制文件;
提供用于存储在高速缓存中的所述编译二进制文件;以及
向安全应用程序提供句柄,其中所述句柄包括对存储在所述高速缓存中的所述编译二进制文件的引用。
3.根据权利要求1所述的方法,其中所述代码还包括与用于所述NN模型的所述权重对应的偏置值和缩放值的参数。
4.根据权利要求1所述的方法,其中所述第二组权重采用对应于文件的第一格式,所述文件包括具有第一组地址的所述第二组权重,所述第一组地址不同于用于所述NN模型中的所述一组权重的第二组地址。
5.根据权利要求1所述的方法,还包括:
为所述一组层中的每个层确定一组转换,所述一组转换将每个层更改为符合运行所述NN模型的目标平台的硬件要求的代码,其中生成所述元数据包括对应于所述一组转换的信息。
6.根据权利要求5所述的方法,其中所述一组转换包括融合缩放和偏置操作,将缩放和偏置层与另一缩放和偏置层融合,或展平层。
7.根据权利要求1所述的方法,其中所述元数据包括与由所述NN模型的相应可变层执行的一组操作的偏移对应的信息。
8.根据权利要求1所述的方法,其中所述元数据包括有关偏移到所述NN网络的编译二进制文件的可变内核数据节区的信息,所述可变内核节区包括在执行所述NN网络期间的可变的相应权重。
9.根据权利要求8所述的方法,其中基于由应用程序提供的权重文件,驱动器部件在运行时期间更新所述NN网络的相应可变权重。
10.根据权利要求9所述的方法,其中所述权重文件包括一组矢量,所述一组矢量包括对应于所述相应可变权重的数据。
11.一种系统,包括:
处理器;
存储器设备,所述存储器设备包含指令,所述指令在由所述处理器执行时使得所述处理器:
接收对应于神经网络(NN)模型的代码和用于所述NN模型的一组权重;
确定所述NN模型中的一组可变层;
技术研发人员:C·M·福雷特,姚笑终,S·哈雷哈拉苏巴曼尼安,
申请(专利权)人:苹果公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。