【技术实现步骤摘要】
深度学习框架调整方法、装置、设备、介质和程序产品
[0001]本申请实施例涉及人工智能
,特别是涉及一种深度学习框架调整方法
、
装置
、
设备
、
介质和程序产品
。
技术介绍
[0002]作为人工智能开发环节中的基础工具,深度学习框架承担着
AI
技术生态中至关重要的角色
。
深度学习框架通过将深度学习算法模块化封装,能够实现训练
、
测试
、
调优模型的快速搭建,为各领域实际应用的落地提供有力支持
。
[0003]相关技术中,通常将深度学习框架运行在异构加速器上,可以在训练模型时,通过异构加速器加速计算,从而减少训练和推理时间
。
[0004]然而,相关技术中,在深度学习框架运行于异构加速器时,深度学习框架与异构加速器存在适配性低的问题
。
技术实现思路
[0005]基于此,有必要针对上述技术问题,提供一种深度学习框架调整方法
、
装置
、
设备
、
介质和程序产品,通过对与异构加速器适配性低的原始深度学习框架进行基础功能的完整适配以及添加额外的优化扩展功能,以提高原始深度学习框架与异构加速器的适配度,进而提升深度学习框架的运行性能,以及保证异构加速器上框架的可用性和部分功能添加
。
[0006]第一方面,本申请实施例提供了一种深度学习框架调整方法,包括:
[0 ...
【技术保护点】
【技术特征摘要】
1.
一种深度学习框架调整方法,其特征在于,所述方法包括:获取原始深度学习框架;所述原始深度学习框架表示与异构加速器适配度小于预设值的深度学习框架;对所述原始深度学习框架进行基础功能移植处理,得到与所述异构加速器的基础功能完整适配的初始深度学习框架;对所述初始深度学习框架添加除所述基础功能外的优化扩展功能,得到与所述异构加速器适配的目标深度学习框架
。2.
根据权利要求1所述的方法,其特征在于,所述对所述原始深度学习框架进行基础功能移植处理,得到与所述异构加速器的基础功能完整适配的初始深度学习框架,包括:获取所述原始深度学习框架的源代码和所述异构加速器的软件栈信息;根据所述软件栈信息,对所述源代码进行代码修改,得到与所述异构加速器的基础功能完整适配的初始深度学习框架
。3.
根据权利要求2所述的方法,其特征在于,所述软件栈信息包括软件栈路径信息和调用软件栈底层库的接口信息,所述根据所述软件栈信息,对所述源代码进行代码修改,得到与所述异构加速器的基础功能完整适配的初始深度学习框架,包括:根据所述软件栈路径信息对所述源代码中的软件栈路径进行修改,以及根据所述接口信息对所述源代码中的软件栈底层库调用接口进行修改,得到修改后的修改源代码;对所述修改源代码进行编译,得到目标代码;在所述目标代码测试与验证均通过的情况下,对所述目标代码进行打包处理,得到所述初始深度学习框架
。4.
根据权利要求3所述的方法,其特征在于,所述对所述修改源代码进行编译,得到目标代码,包括:将所述修改源代码中与编译相关的路径标识由有效逻辑值修改为无效逻辑值,得到更新源代码;对所述更新源代码进行编译,得到所述目标代码
。5.
根据权利要求1‑4任一项所述的方法,其特征在于,所述优化扩展功能包括性能分析功能
、
结果可复现功能和半精度性能优化功能,所述对所述初始深度学习框架添加除所述基础功能外的优化扩展功能,得到与所述异构加速器适配的目标深度学习框架,包括:获取与所述性能分析功能相关的性能分析函数
、
与所述结果可复现功能相关的可复现环境变量
、
与所述半...
【专利技术属性】
技术研发人员:潘宁,胡辰,钱永军,
申请(专利权)人:中科曙光国际信息产业有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。