当前位置: 首页 > 专利查询>英特尔公司专利>正文

用于重新设定粒度的片执行的统一编程接口制造技术

技术编号:40823902 阅读:17 留言:0更新日期:2024-04-01 14:44
本文公开了用于重新设定粒度的片执行的统一编程接口。系统、设备和方法可以提供进行以下操作的技术:检测应用中的张量操作,其中张量操作具有未指定的张量输入尺寸;在运行时确定输入张量尺寸;以及至少部分地基于输入张量尺寸和一个或多个运行时条件来选择用于张量操作的分区配置。在一个示例中,该技术在查找表中搜索输入张量尺寸和(多个)运行时条件中的至少一个运行时条件,以选择分区配置。

【技术实现步骤摘要】

实施例通常涉及应用编程接口(api)。更具体地,实施例涉及用于重新设定粒度的(regrained)片(tile)执行的统一编程接口。


技术介绍

1、指令集架构(isa)通常可以为处理器操作(诸如数据处理、存储器操作、算术操作、控制流操作等)定义支持的数据类型、寄存器和硬件支持。人工智能(ai)的最新发展可能导致isa的扩展,以更明确地支持神经网络训练和推断操作。因此,软件开发人员可以在ai应用中定制代码,以利用扩展isa所促进的新的计算功能和加速的执行。但是,尤其在跨不同isa和处理器部署应用时,代码的定制可能是耗时的、昂贵的、且效率低下的。


技术实现思路

【技术保护点】

1.一种方法,包括:

2.如权利要求1所述的方法,其中,对所述张量操作进行分区包括:

3.如权利要求2所述的方法,其中,将所述输入张量分区为所述多个数据片包括:

4.如权利要求2所述的方法,其中,对所述张量操作进行分区进一步包括:

5.如权利要求1所述的方法,其中,所述一个或多个硬件资源包括用于运行所述张量操作的处理单元。

6.如权利要求1所述的方法,其中,所述一个或多个硬件资源包括用于存储所述张量操作的输入张量或输出张量的存储器。

7.如权利要求1所述的方法,其中,所述张量操作包括矩阵乘法运算操作。

8...

【技术特征摘要】

1.一种方法,包括:

2.如权利要求1所述的方法,其中,对所述张量操作进行分区包括:

3.如权利要求2所述的方法,其中,将所述输入张量分区为所述多个数据片包括:

4.如权利要求2所述的方法,其中,对所述张量操作进行分区进一步包括:

5.如权利要求1所述的方法,其中,所述一个或多个硬件资源包括用于运行所述张量操作的处理单元。

6.如权利...

【专利技术属性】
技术研发人员:S·巴格索克希M·R·哈格海特
申请(专利权)人:英特尔公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1