【技术实现步骤摘要】
本专利技术涉及计算机,特别涉及一种人工智能加速卡适配方法、装置、设备及存储介质。
技术介绍
1、当前,pytorch框架(深度学习框架),支持amd和nvidia ai(artificialintelligence,人工智能)加速卡,但是是直接在pytorch框架源码中进行支持,通过宏定义等方法区分实际编译的ai加速卡,由于pytorch框架源码量非常大,适配多个ai加速卡时,不同ai加速卡适配相互影响,开发难度大。
2、并且,pytorch底层包含2000多个内核(内核),内核开发工作量非常大,虽然各个ai加速卡厂商都开发了高性能算子库,但存在算子名称、参数的差异性,直接基于源码适配pytoch的方案,通用性差,无法快速适配pytorch框架,也就是说,各个ai加速卡厂商的ai加速卡的架构设计不同,不同ai加速卡厂商都需要将pytorch框架适配工作单独开发一遍,工作存在大量的重复,同时直接适配pytorch框架要求开发人员既要掌握pytorch框架源码内容,又要掌握ai加速卡底层软件栈的相关内容,代码开发耦合度高,导致适
...【技术保护点】
1.一种人工智能加速卡适配方法,其特征在于,包括:
2.根据权利要求1所述的人工智能加速卡适配方法,其特征在于,所述将各所述抽象后的加速卡底层软件栈配置为后端,并将作为前端的所述目标深度学习框架与作为所述后端的所述抽象后的加速卡底层软件栈进行分离之后,还包括:
3.根据权利要求1所述的人工智能加速卡适配方法,其特征在于,还包括:
4.根据权利要求1所述的人工智能加速卡适配方法,其特征在于,还包括:
5.根据权利要求1所述的人工智能加速卡适配方法,其特征在于,还包括:
6.根据权利要求1至5任一项所述的人工智能
...【技术特征摘要】
1.一种人工智能加速卡适配方法,其特征在于,包括:
2.根据权利要求1所述的人工智能加速卡适配方法,其特征在于,所述将各所述抽象后的加速卡底层软件栈配置为后端,并将作为前端的所述目标深度学习框架与作为所述后端的所述抽象后的加速卡底层软件栈进行分离之后,还包括:
3.根据权利要求1所述的人工智能加速卡适配方法,其特征在于,还包括:
4.根据权利要求1所述的人工智能加速卡适配方法,其特征在于,还包括:
5.根据权利要求1所述的人工智能加速卡适配方法,其特征在于,还包括:
6.根据权利要求1至5任一项所述的人工智能加速卡适配方法,其特征在于,还包括:
7....
【专利技术属性】
技术研发人员:贾敬崧,
申请(专利权)人:山东云海国创云计算装备产业创新中心有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。