确定算子切分策略的方法和装置制造方法及图纸

技术编号:41921206 阅读:30 留言:0更新日期:2024-07-05 14:20
本发明专利技术实施例公开了一种确定算子切分策略的方法和装置,本发明专利技术实施例通过设置张量切分信息表,记录目标计算拓扑中各张量的切分信息,利用张量作为不同算子之间联系的特点,以张量数据的切分为中心,通过遍历各个算子的方式逐一确定满足硬件存储资源限制的切分策略,并据此逐步更新记录张量切分信息表,直至最终得到整个目标计算拓扑的张量的整体的切分信息。由此,本发明专利技术实施例可以不通过算子融合,就整体地减少对于全局内存的访问,提高内存读写的局部性,从而提高编译器的计算性能,保持算子的扩展性。

【技术实现步骤摘要】

本专利技术涉及人工智能硬件领域,具体涉及在人工智能芯片中进行计算拓扑的确定算子切分策略的方法和装置


技术介绍

1、近年来,随着人工智能的不断发展,行业内对于人工智能ai(art if i c i a l inte l l igence)芯片的算力要求也在不断提高。不同于传统通用芯片,ai芯片由于其特殊的应用场景和需求,其通常需要原生支持各种数学运算,也即算子。

2、为了提高计算速度和降低计算过程中对于全局内存(g l oba l memery)的访问次数,在实际运算过程中,ai芯片通常会将较大的数据块进行切分(ti l i ng),然后再将切分后的各数据块分别读取到本地内存(loca l mermery)中进行后续计算。

3、但是现有的确定算子切分策略的方法只针对单个算子选择器内部局部最优的切分方式,并不考虑这种切分方式后续对于计算拓扑可能的不良影响,如图1所示,在一个包括两个算子11和12的计算拓扑中,分别将算子11切分为4个子算子11a-11d,将算子12切分为3个子算子12a-12c。由于两者切分参数不同,虽然对于算子本身局本文档来自技高网...

【技术保护点】

1.一种确定算子切分策略的方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:

4.根据权利要求2所述的方法,其特征在于,所述确定目标算子的输出张量的第二切分信息包括:

5.根据权利要求4所述的方法,其特征在于,所述候选切分维度的类型包括并行切分维度和规约切分维度;

6.根据权利要求4所述的方法,其特征在于,所述按照所述优先级,依次评价各候选切分维度的不同切分参数,以确定所述第二切分信息包括:

7.根据权利要求4-...

【技术特征摘要】

1.一种确定算子切分策略的方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:

4.根据权利要求2所述的方法,其特征在于,所述确定目标算子的输出张量的第二切分信息包括:

5.根据权利要求4所述的方法,其特征在于,所述候选切分维度的类型包括并行切分维度和规约切分维度;

6.根据权利要求4所述的方法,其特征在于,所述按照所述优先级,依次评价各候选切分维度的不同切分参数,以确定所述第二切分信息包括:

7.根据权利...

【专利技术属性】
技术研发人员:刘雷
申请(专利权)人:北京希姆计算科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1