【技术实现步骤摘要】
深度学习框架适配方法、装置、计算机设备和存储介质
[0001]本申请涉及计算
,特别是涉及一种深度学习框架适配方法
、
装置
、
计算机设备和存储介质
。
技术介绍
[0002]随着深度学习模型的快速发展,对深度学习框架的训练和推理速度等提出了更高的要求
。
[0003]相关技术中,为了提高深度学习模型的训练和推理速度,可以将深度学习框架与异构加速器进行研发适配,通过异构加速器并行执行深度学习框架中的计算任务
。
[0004]然而,相关技术中的深度学习框架与异构加速器之间存在兼容性较差的问题,导致深度学习框架无法在异构加速器上稳定运行
。
技术实现思路
[0005]基于此,有必要针对上述技术问题,提供一种深度学习框架适配方法
、
装置
、
计算机设备和存储介质,能够提高深度学习框架与异构加速器之间的兼容性,使得深度学习框架能够在异构加速器上稳定运行
。
[0006]第一方面,本 ...
【技术保护点】
【技术特征摘要】
1.
一种深度学习框架适配方法,其特征在于,所述方法包括:获取异构加速器的运行信息和运行需求,所述运行信息和所述运行需求均表示所述异构加速器执行目标深度学习框架的计算任务时的信息;根据所述运行信息对所述目标深度学习框架的源代码进行修改,并根据所述运行需求对所述目标深度学习框架的三方库代码进行修改;对修改后的深度学习框架进行评估验证;若所述修改后的深度学习框架评估验证通过,则将所述修改后的深度学习框架确定为与所述异构加速器适配的深度学习框架
。2.
根据权利要求1所述的方法,其特征在于,所述运行信息包括运行时接口信息和所述异构加速器使用数学库时依赖库文件;所述根据所述运行信息对所述目标深度学习框架的源代码进行修改,包括:根据所述运行时接口信息,对所述目标深度学习框架的源代码中对应的接口代码进行修改;以及根据所述异构加速器使用数学库时依赖库文件,对所述目标深度学习框架的源代码中对应的库文件路径进行修改
。3.
根据权利要求1或2所述的方法,其特征在于,所述运行需求包括执行方式;所述根据所述运行需求对所述目标深度学习框架的三方库代码进行修改,包括:根据所述三方库代码的存储位置,获取所述目标深度学习框架的三方库代码;基于所述异构加速器的执行方式,获取所述异构加速器的指令集代码,并根据所述指令集代码对所述三方库代码进行修改
。4.
根据权利要求1或2所述的方法,其特征在于,所述对修改后的深度学习框架进行评估验证,包括:对所述修改后的深度学习框架进行编译;若编译通过,则对所述修改后的深度学习框架的代码进行单元测试;若所述单元测试通过,则继续对所述修改后的深度学习框架的代码进行基准测试;若所述基准测试通过,则确定所述修改后的深度学习框架的评估验证通过
。5.
根据权利要求4所述的方法,其特征在于,所述对所述修改后的深度学习框架进行编译,包括:根据所述目标深度学习框架的配置版本,确定所述修改后的深度学习框架的编译环境;根据所述编译环境和预设的编译命令,对所述修改后的深度学习框架进行编译;若编译失败,则根据编译失败生成的日志报错信息,对所述修改后的深度学习框架进行调整,直至所...
【专利技术属性】
技术研发人员:钱永军,胡辰,潘宁,
申请(专利权)人:中科曙光国际信息产业有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。