深度学习模型的转化方法、装置、服务器及存储介质制造方法及图纸

技术编号：24355546 阅读：24 留言：0更新日期：2020-06-03 02:28

本发明专利技术实施例公开了一种深度学习模型的转化方法、装置、服务器及存储介质，所述方法包括：将目标深度学习模型解析为指令集计算图中间表达；将所述指令集计算图中间表达转化为数据流计算图中间表达；将所述数据流计算图中间表达调整为定制化架构中间表达；根据所述定制化架构中间表达，得到所述目标深度学习模型所对应转化的目标数据流网络模型。实现了将基于指令集架构开发的深度学习模型转化到数据流架构下运行，使用指令集计算图中间表达、数据流计算图中间表达和定制化架构中间表达来描述深度学习模型，可以根据实际需求在易读性和执行效率等方面做权衡，使得设计更为灵活。

Transformation method, device, server and storage medium of deep learning model

全部详细技术资料下载

【技术实现步骤摘要】
深度学习模型的转化方法、装置、服务器及存储介质
本专利技术实施例涉及深度学习技术，例如涉及一种深度学习模型的转化方法、装置、服务器及存储介质。
技术介绍
深度学习网络通常由算法训练得来。多数情况下，算法开发人员倾向于使用公开的深度学习框架进行模型训练，一种深度学习框架可以开发出多个深度学习模型，而大部分公开的深度学习框架是针对于中央处理器/图形处理器(CentralProcessingUnit/GraphicsProcessingUnit，CPU/GPU)这类计算设备设计的。CPU/GPU采用传统的指令集架构，架构效率较低，算子颗粒度较小，因而灵活度较高。随着深度学习相关技术的发展，对于算力的要求越来越高。传统指令集的架构效率缺陷已经不能满足应用场景的需求。对比而言，数据流架构效率更高，从技术路线来看更加适合深度学习技术的发展趋势。然而，数据流架构于指令集架构的数据表达存在较大差异：数据流架构算子颗粒度要远大于指令集架构；数据流架构算子计算前要预先根据数据依赖确定计算模块的排列顺序。这种差异决定了指令集架构下训练得来的模型不能直接部署在数据流架构中，这大大阻碍了数据流架构的应用发展。
技术实现思路
本专利技术实施例提供一种深度学习模型的转化方法、装置、服务器及存储介质，以实现将基于指令集架构开发的深度学习模型转化到数据流架构下运行。在一实施例中，本专利技术实施例提供一种深度学习模型的转化方法，包括：将目标深度学习模型解析为指令集计算图中间表达；将所述指令集计算图中间...

【技术保护点】
1.一种深度学习模型的转化方法，其特征在于，包括：/n将目标深度学习模型解析为指令集计算图中间表达；/n将所述指令集计算图中间表达转化为数据流计算图中间表达；/n将所述数据流计算图中间表达调整为定制化架构中间表达；/n根据所述定制化架构中间表达，得到所述目标深度学习模型所对应转化的目标数据流网络模型。/n

【技术特征摘要】
1.一种深度学习模型的转化方法，其特征在于，包括：
将目标深度学习模型解析为指令集计算图中间表达；
将所述指令集计算图中间表达转化为数据流计算图中间表达；
将所述数据流计算图中间表达调整为定制化架构中间表达；
根据所述定制化架构中间表达，得到所述目标深度学习模型所对应转化的目标数据流网络模型。

2.如权利要求1所述的方法，其特征在于，所述目标深度学习模型包括第一算子颗粒度，所述指令集计算图中间表达包括第二算子颗粒度，所述数据流计算图中间表达包括第三算子颗粒度。

3.如权利要求2所述的方法，其特征在于，所述第一算子颗粒度与所述第二算子颗粒度相同。

4.如权利要求2所述的方法，其特征在于，所述第二算子颗粒度小于所述第三算子颗粒度。

5.如权利要求2所述的方法，其特征在于，所述指令集计算图中间表达还包括第一算子，所述数据流计算图中间表达还包括第二算子。

6.如权利要求5所述的方法，其特征在于，多个所述第一算子通过融合转化形成所述第二算子。

7.一种深度学习模型的转化装置，包...

【专利技术属性】
技术研发人员：熊超，蔡权雄，牛昕宇，
申请(专利权)人：深圳鲲云信息科技有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人