【技术实现步骤摘要】
本申请涉及人工智能,尤其涉及一种算子的编译方法、装置、设备及介质。
技术介绍
1、随着生成式人工智能(artificial intelligence,ai)的兴起,由生成式ai引发的算力竞争也愈发激烈。triton是目前流行的深度学习算子开发工具,它基于python语言,隐藏了芯片的架构信息,把架构相关优化留给编译器来做,大幅度降低了算子开发难度。
2、但当前采用不同芯片架构的各厂商的芯片在对接triton时,出于保护其芯片的架构信息的目的,厂商通常以代码闭源方式对接triton,基于triton开发的算子需要完全使用芯片厂商开发的triton编译器进行编译,导致算子的编译过程无法基于开源社区来优化和拓展。
技术实现思路
1、本申请提供一种算子的编译方法、装置、设备及介质,能够便于算子编译过程中的部分阶段实现开源,从而便于基于开源对算子的部分编译过程进行优化和拓展。
2、为达到上述目的,本申请采用如下技术方案:
3、第一方面,提供了一种算子的编译方法,该
...【技术保护点】
1.一种算子的编译方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述目标芯片为通用图形处理器,所述基于所述Triton中间表示对算子进行不涉及芯片信息的优化,得到优化后的中间表示,包括:
3.根据权利要求1所述的方法,其特征在于,所述目标芯片为应用特定集成电路,所述基于所述Triton中间表示对算子进行不涉及芯片信息的优化,得到优化后的中间表示,包括:
4.根据权利要求3所述的方法,其特征在于,所述将所述Triton中间表示转换为线性代数方言,包括:
5.根据权利要求1-4任一项所述的方法,其特征在
...【技术特征摘要】
1.一种算子的编译方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述目标芯片为通用图形处理器,所述基于所述triton中间表示对算子进行不涉及芯片信息的优化,得到优化后的中间表示,包括:
3.根据权利要求1所述的方法,其特征在于,所述目标芯片为应用特定集成电路,所述基于所述triton中间表示对算子进行不涉及芯片信息的优化,得到优化后的中间表示,包括:
4.根据权利要求3所述的方法,其特征在于,所述将所述triton中间表示转换为线性代数方言,包括:
5.根据权利要求1-4任一项所述的方法,其特征在于,所述将所述算子源代码转换为triton中间表示,包括:
6.根据权利要求1所述的方法,其特征在于,所述芯片信息包括芯片的架构类型、芯片的核心数量、芯片的指令集扩展架构信息、芯片的内存层次结构信息...
【专利技术属性】
技术研发人员:朱天阳,吴震宇,黄灏,
申请(专利权)人:中科加禾杭州科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。