【技术实现步骤摘要】
实施例通常涉及应用编程接口(api)。更具体地,实施例涉及用于重新设定粒度的(regrained)片(tile)执行的统一编程接口。
技术介绍
1、指令集架构(isa)通常可以为处理器操作(诸如数据处理、存储器操作、算术操作、控制流操作等)定义支持的数据类型、寄存器和硬件支持。人工智能(ai)的最新发展可能导致isa的扩展,以更明确地支持神经网络训练和推断操作。因此,软件开发人员可以在ai应用中定制代码,以利用扩展isa所促进的新的计算功能和加速的执行。但是,尤其在跨不同isa和处理器部署应用时,代码的定制可能是耗时的、昂贵的、且效率低下的。
技术实现思路
【技术保护点】
1.一种方法,包括:
2.如权利要求1所述的方法,其中,对所述张量操作进行分区包括:
3.如权利要求2所述的方法,其中,将所述输入张量分区为所述多个数据片包括:
4.如权利要求2所述的方法,其中,对所述张量操作进行分区进一步包括:
5.如权利要求1所述的方法,其中,所述一个或多个硬件资源包括用于运行所述张量操作的处理单元。
6.如权利要求1所述的方法,其中,所述一个或多个硬件资源包括用于存储所述张量操作的输入张量或输出张量的存储器。
7.如权利要求1所述的方法,其中,所述张量操作包括矩阵乘法运算操
8...
【技术特征摘要】
1.一种方法,包括:
2.如权利要求1所述的方法,其中,对所述张量操作进行分区包括:
3.如权利要求2所述的方法,其中,将所述输入张量分区为所述多个数据片包括:
4.如权利要求2所述的方法,其中,对所述张量操作进行分区进一步包括:
5.如权利要求1所述的方法,其中,所述一个或多个硬件资源包括用于运行所述张量操作的处理单元。
6.如权利...
【专利技术属性】
技术研发人员:S·巴格索克希,M·R·哈格海特,
申请(专利权)人:英特尔公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。