System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 机器学习任务到共享高速缓存中的分配制造技术_技高网
当前位置: 首页 > 专利查询>苹果公司专利>正文

机器学习任务到共享高速缓存中的分配制造技术

技术编号:40552049 阅读:7 留言:0更新日期:2024-03-05 19:11
本公开涉及机器学习任务到共享高速缓存中的分配。本主题技术接收对应于神经网络(NN)模型的代码,所述代码包括由NN模型执行的特定操作。在所述特定操作中,本主题技术确定将分配给要执行所述NN模型的电子设备的高速缓存的一组操作。本主题技术生成对应于所述确定的一组操作的一组高速缓存指示器。本主题技术编译所述代码和所述生成的一组高速缓存指示器,以提供用于所述NN模型的编译的二进制文件以在目标设备上执行。

【技术实现步骤摘要】

本说明书整体涉及编译神经网络模型以在目标平台上执行。


技术介绍

1、软件工程师和科学家一直在使用计算机硬件进行机器学习,以在不同的行业应用(包括图像分类、视频分析、语音识别和自然语言处理等)中进行改进。值得注意的是,基于来自大量数据的训练,神经网络被更频繁地用于创建可以执行不同计算任务的系统。


技术实现思路

【技术保护点】

1.一种方法,包括:

2.根据权利要求1所述的方法,其中所述操作由神经处理器、GPU或CPU中的至少一者执行,并且所述操作中的每个操作对应于由所述NN模型执行的至少机器学习操作,并且所述高速缓存在所述神经处理器、所述GPU和所述CPU之间共享。

3.根据权利要求2所述的方法,其中至少部分地基于当所述NN模型由所述目标设备执行时特定操作使用的存储器的预先确定的量,将存储器的相应配额分配给所述神经处理器、所述GPU或所述CPU中的至少一者。

4.根据权利要求3所述的方法,其中至少部分地基于由所述目标设备提供的高速缓存存储器的大小来约束所述存储器的相应配额,并且

5.根据权利要求1所述的方法,其中所述操作仅包括一个操作。

6.根据权利要求1所述的方法,其中生成对应于所述操作的所述一组高速缓存指示器还包括生成指示特定操作仅使用数据一次并且所述数据将被存储在比所述高速缓存慢的第二存储器中的另外信息。

7.根据权利要求1所述的方法,其中生成对应于所述操作的所述一组高速缓存指示器还包括生成指示特定操作使用数据多次以及所述数据将被存储在所述高速缓存中的另外信息。

8.根据权利要求1所述的方法,其中生成对应于所述操作的所述一组高速缓存指示器包括生成指示用以使与所述操作不再利用的数据相对应的所述高速缓存的一部分失效的高速缓存删除操作的另外信息。

9.根据权利要求1所述的方法,其中确定所述一组高速缓存指示器至少部分地基于特定操作是否使用在所述特定操作的执行期间被访问不止一次的数据。

10.根据权利要求1所述的方法,其中要分配给所述高速缓存的所述一组操作至少部分地基于一组优先级,所述一组优先级指示特定数据被给定的优先级高于其他数据,以基于性能要求或能源要求放置在所述高速缓存中。

11.一种系统,包括:

12.根据权利要求11所述的系统,其中所述操作由神经处理器、GPU或CPU中的至少一者执行,并且所述操作中的每个操作对应于由所述NN模型执行的至少机器学习操作,并且所述高速缓存在所述神经处理器、所述GPU和所述CPU之间共享。

13.根据权利要求12所述的系统,其中至少部分地基于当所述NN模型由所述目标设备执行时特定操作使用的存储器的预先确定的量,将存储器的相应配额分配给所述神经处理器、所述GPU或所述CPU中的至少一者。

14.根据权利要求13所述的系统,其中至少部分地基于由所述目标设备提供的高速缓存存储器的大小来约束所述存储器的相应配额,并且所述存储器的相应配额是动态的,使得在由所述目标设备执行所述NN模型期间,使所述目标设备的特定处理器能够至少部分地基于所述存储器的相应配额来请求存储器的分配。

15.根据权利要求14所述的系统,其中所述操作仅包括一个操作。

16.根据权利要求11所述的系统,其中生成对应于所述操作的所述一组高速缓存指示器还使所述处理器生成指示特定操作仅使用数据一次并且所述数据将被存储在比所述高速缓存慢的第二存储器中的另外信息。

17.根据权利要求11所述的系统,其中生成对应于所述操作的所述一组高速缓存指示器还使所述处理器生成指示特定操作使用数据多次并且所述数据将被存储在所述高速缓中的另外信息。

18.根据权利要求11所述的系统,其中生成对应于所述操作的所述一组高速缓存指示器还使所述处理器生成指示用以使与所述操作不再利用的数据相对应的所述高速缓存的一部分失效的高速缓存删除操作的另外信息。

19.根据权利要求11所述的系统,其中确定所述操作至少部分地基于特定操作是否使用在所述特定操作的执行期间被访问不止一次的数据。

20.一种包括指令的非暂态计算机可读介质,所述指令在由计算设备执行时,使所述计算设备执行包括以下操作的操作:

...

【技术特征摘要】

1.一种方法,包括:

2.根据权利要求1所述的方法,其中所述操作由神经处理器、gpu或cpu中的至少一者执行,并且所述操作中的每个操作对应于由所述nn模型执行的至少机器学习操作,并且所述高速缓存在所述神经处理器、所述gpu和所述cpu之间共享。

3.根据权利要求2所述的方法,其中至少部分地基于当所述nn模型由所述目标设备执行时特定操作使用的存储器的预先确定的量,将存储器的相应配额分配给所述神经处理器、所述gpu或所述cpu中的至少一者。

4.根据权利要求3所述的方法,其中至少部分地基于由所述目标设备提供的高速缓存存储器的大小来约束所述存储器的相应配额,并且

5.根据权利要求1所述的方法,其中所述操作仅包括一个操作。

6.根据权利要求1所述的方法,其中生成对应于所述操作的所述一组高速缓存指示器还包括生成指示特定操作仅使用数据一次并且所述数据将被存储在比所述高速缓存慢的第二存储器中的另外信息。

7.根据权利要求1所述的方法,其中生成对应于所述操作的所述一组高速缓存指示器还包括生成指示特定操作使用数据多次以及所述数据将被存储在所述高速缓存中的另外信息。

8.根据权利要求1所述的方法,其中生成对应于所述操作的所述一组高速缓存指示器包括生成指示用以使与所述操作不再利用的数据相对应的所述高速缓存的一部分失效的高速缓存删除操作的另外信息。

9.根据权利要求1所述的方法,其中确定所述一组高速缓存指示器至少部分地基于特定操作是否使用在所述特定操作的执行期间被访问不止一次的数据。

10.根据权利要求1所述的方法,其中要分配给所述高速缓存的所述一组操作至少部分地基于一组优先级,所述一组优先级指示特定数据被给定的优先级高于其他数据,以基于性能要求或能源要求放置在所述高速缓存中。

11.一种系统,包括:

12.根据权利...

【专利技术属性】
技术研发人员:F·P·万纳C·M·福雷特姚笑终S·哈雷哈拉苏巴曼尼安
申请(专利权)人:苹果公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1