一种人工智能加速卡适配方法、装置、设备及存储介质制造方法及图纸

技术编号:41521000 阅读:27 留言:0更新日期:2024-05-30 14:56
本发明专利技术公开了一种人工智能加速卡适配方法、装置、设备及存储介质,涉及计算机技术领域,包括:在目标深度学习框架中添加作为人工智能加速卡的适配接口的虚拟设备;进而注册分布式通讯接口,利用分布式通讯接口调用预设人工智能算力执行框架;获取各人工智能加速卡的底层软件栈,利用预设人工智能算力执行框架对各人工智能加速卡的底层软件栈进行抽象设计;将各抽象后的加速卡底层软件栈配置为后端,将作为前端的目标深度学习框架与作为后端的抽象后的加速卡底层软件栈进行分离,以完成人工智能加速卡与目标深度学习框架之间的适配操作。本发明专利技术通过前后端分离方式实现人工智能加速卡适配,提高人工智能加速卡适配深度学习框架的易用性和通用性。

【技术实现步骤摘要】

本专利技术涉及计算机,特别涉及一种人工智能加速卡适配方法、装置、设备及存储介质


技术介绍

1、当前,pytorch框架(深度学习框架),支持amd和nvidia ai(artificialintelligence,人工智能)加速卡,但是是直接在pytorch框架源码中进行支持,通过宏定义等方法区分实际编译的ai加速卡,由于pytorch框架源码量非常大,适配多个ai加速卡时,不同ai加速卡适配相互影响,开发难度大。

2、并且,pytorch底层包含2000多个内核(内核),内核开发工作量非常大,虽然各个ai加速卡厂商都开发了高性能算子库,但存在算子名称、参数的差异性,直接基于源码适配pytoch的方案,通用性差,无法快速适配pytorch框架,也就是说,各个ai加速卡厂商的ai加速卡的架构设计不同,不同ai加速卡厂商都需要将pytorch框架适配工作单独开发一遍,工作存在大量的重复,同时直接适配pytorch框架要求开发人员既要掌握pytorch框架源码内容,又要掌握ai加速卡底层软件栈的相关内容,代码开发耦合度高,导致适配难度高、开发工作量本文档来自技高网...

【技术保护点】

1.一种人工智能加速卡适配方法,其特征在于,包括:

2.根据权利要求1所述的人工智能加速卡适配方法,其特征在于,所述将各所述抽象后的加速卡底层软件栈配置为后端,并将作为前端的所述目标深度学习框架与作为所述后端的所述抽象后的加速卡底层软件栈进行分离之后,还包括:

3.根据权利要求1所述的人工智能加速卡适配方法,其特征在于,还包括:

4.根据权利要求1所述的人工智能加速卡适配方法,其特征在于,还包括:

5.根据权利要求1所述的人工智能加速卡适配方法,其特征在于,还包括:

6.根据权利要求1至5任一项所述的人工智能加速卡适配方法,其特...

【技术特征摘要】

1.一种人工智能加速卡适配方法,其特征在于,包括:

2.根据权利要求1所述的人工智能加速卡适配方法,其特征在于,所述将各所述抽象后的加速卡底层软件栈配置为后端,并将作为前端的所述目标深度学习框架与作为所述后端的所述抽象后的加速卡底层软件栈进行分离之后,还包括:

3.根据权利要求1所述的人工智能加速卡适配方法,其特征在于,还包括:

4.根据权利要求1所述的人工智能加速卡适配方法,其特征在于,还包括:

5.根据权利要求1所述的人工智能加速卡适配方法,其特征在于,还包括:

6.根据权利要求1至5任一项所述的人工智能加速卡适配方法,其特征在于,还包括:

7....

【专利技术属性】
技术研发人员:贾敬崧
申请(专利权)人:山东云海国创云计算装备产业创新中心有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1