优化神经网络模型的编译方法、执行方法及相关产品技术

技术编号：30320813 阅读：30 留言：0更新日期：2021-10-09 23:39

本披露公开了一种用于优化神经网络模型的编译方法、设备和计算机程序产品，还公开了一种在异构处理系统上执行神经网络模型的方法及异构处理系统。该设备可以实现为计算装置包括在组合处理装置中，该组合处理装置还可以包括接口装置和其他处理装置。该计算装置与其他处理装置进行交互，共同完成用户指定的计算操作。组合处理装置还可以包括存储装置，该存储装置分别与计算装置和其他处理装置连接，用于存储该计算装置和其他处理装置的数据。本披露的方案提供了神经网络模型中的重塑层的优化方案，其可以有效减少片外访存带宽，缓解访存压力，提高机器的处理效率。提高机器的处理效率。提高机器的处理效率。

全部详细技术资料下载

【技术实现步骤摘要】
优化神经网络模型的编译方法、执行方法及相关产品

[0001]本披露一般地涉及数据处理领域。更具体地，本披露涉及一种用于优化神经网络模型的编译方法、设备和计算机程序产品。本披露还涉及一种在异构处理系统上执行神经网络模型的方法及异构处理系统。

技术介绍

[0002]目前，深度学习(Deep Learning)已经成为机器学习中的重要分支，也大力助推着人工智能(AI)的发展。深度学习的核心技术——深度神经网络(DNN)已在诸多行业有着广泛的应用。
[0003]为了提高神经网络模型的表达能力，DNN不断向着更深或更宽的网络规模发展。然而网络层级的增加也带来了数据IO量大、访存供不上数等问题。因此，为了能充分发挥神经网络模型的优势，需要解决人工智能处理器面临的访存困扰问题。

技术实现思路

[0004]为了至少部分地解决
技术介绍
中提到的一个或多个技术问题，本披露的方案提供了一种用于优化神经网络模型的编译方法、设备和计算机程序产品。本披露还涉及一种在异构处理系统上执行神经网络模型的方法及异构处理系统。
[0005]在第一方面中，本披露公开一种用于优化神经网络模型的编译方法，其中所述神经网络模型包括至少一个重塑层，用于将其上一层输出的具有第一形状的第一数据转换为具有第二形状的第二数据以提供给其下一层，所述编译方法包括：获取所述第一数据的第一虚拟地址和所述第二数据的第二虚拟地址；将所述第一虚拟地址和第二虚拟地址映射到同一物理地址；删除所述重塑层以优化所述神经网络模型；以及将优化后的所述神经网络模型编译成...

【技术保护点】

【技术特征摘要】
1.一种用于优化神经网络模型的编译方法，其中所述神经网络模型包括至少一个重塑层，用于将其上一层输出的具有第一形状的第一数据转换为具有第二形状的第二数据以提供给其下一层，所述编译方法包括：获取所述第一数据的第一虚拟地址和所述第二数据的第二虚拟地址；将所述第一虚拟地址和第二虚拟地址映射到同一物理地址；删除所述重塑层以优化所述神经网络模型；以及将优化后的所述神经网络模型编译成对应的指令序列，以分配至人工智能处理器上执行对应的任务。2.根据权利要求1所述的编译方法，其中删除所述重塑层包括：将所述重塑层的上一层的输出直接连接到所述重塑层的下一层的输入。3.根据权利要求2所述的编译方法，还包括：将所述第二数据的形状参数传递给所述重塑层的下一层。4.根据权利要求1
‑
3任一所述的编译方法，其中所述神经网络模型由计算图表示，并且删除所述重塑层包括删除所述计算图中对应所述重塑层的计算节点。5.一种用于优化神经网络模型的设备，包括：至少一个处理器；以及至少一个存储器，其用于存储程序指令，当所述程序指令由所述至少一个处理器加载并执行时，使得所述设备执行根据权利要求1
‑
4中任一所述的方法。6.一种计算机程序产品，包括程序指令，所述程序指令在被处理器执行时，实现根据权利要求1
‑
4中任一所述的方法。7.一种在异构处理系统上执行神经网络模型的方法，所述异构处理系统包括通用处理器、人工智能处理器和片外存储器，所述方法包括：所述通用处理器执行所述片外存储器和所述人工智能处理器侧的内存空间分配；将为执行所述神经网络模型...

【专利技术属性】
技术研发人员：ꢀ七四专利代理机构，
申请(专利权)人：上海寒武纪信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人