网络模型处理方法、装置及系统制造方法及图纸

技术编号：41258852 阅读：15 留言：0更新日期：2024-05-11 09:17

本申请涉及一种网络模型处理方法、装置及系统，涉及网络模型领域。该方法包括：获取网络模型，该网络模型包括按照预设顺序连接的多个算子；对该多个算子进行编译，得到按照预设顺序连接的多个内核代码，该多个算子与该多个内核代码一一对应，该多个内核代码中的每个内核代码中包含地址指示信息，地址指示信息用于指示对应的内核代码的执行数据的存储地址。通过编译时在多个内核代码中写入地址指示信息，减小执行时主机需要发送的参数的大小，从而减小主机向硬件加速器发送内核代码对应的参数时的带宽开销，以及硬件加速器处理内核代码对应的参数的头开销。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及网络模型领域，尤其涉及网络模型处理方法、装置及系统。

技术介绍

1、使用硬件加速器运行网络模型可以减轻中央处理器(central processing unit，cpu)的运行负荷，使计算机执行性能提升。网络模型通常具有较多的算子(operator，op)，每个算子在编译后生成内核代码，计算机通过执行内核代码，从而执行算子所代表的网络模型运算步骤。主机将多个内核代码发送给硬件加速器执行时，还需要发送每个内核代码对应的参数。硬件加速器处理内核代码对应的参数，然后，根据内核代码对应的参数执行内核代码。因此，现有技术存在：主机向硬件加速器发送内核代码对应的参数时的带宽开销大、硬件加速器处理内核代码对应的参数的头开销大等问题。

技术实现思路

1、本申请提供一种网络模型处理方法、装置及系统，解决了现有技术中存在的：主机向硬件加速器发送内核代码对应的参数时的带宽开销大、硬件加速器处理内核代码对应的参数的头开销大的问题。

2、为达到上述目的，本申请采用如下技术方案：

3...

【技术保护点】

1.一种网络模型处理方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述地址指示信息包含偏移地址，所述存储地址是根据基地址和所述偏移地址确定的。

3.根据权利要求1至2任一项所述的方法，其特征在于，所述多个内核代码包括在所述预设顺序中位于首位的第一内核代码，所述第一内核代码的执行数据包括第一输出数据，所述第一内核代码中的地址指示信息用于指示所述第一输出数据的存储地址；

4.根据权利要求3所述的方法，其特征在于，所述多个内核代码还包括位于所述第一内核代码与所述第二内核代码之间的第三内核代码，所述第三内核代码的执行数据包括第二输入数据和...

【技术特征摘要】

1.一种网络模型处理方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述地址指示信息包含偏移地址，所述存储地址是根据基地址和所述偏移地址确定的。

4.根据权利要求3所述的方法，其特征在于，所述多个内核代码还包括位于所述第一内核代码与所述第二内核代码之间的第三内核代码，所述第三内核代码的执行数据包括第二输入数据和第二输出数据，所述第三内核代码中的地址指示信息用于指示所述第二输入数据的存储地址和所述第二输出数据的存储地址。

5.根据权利要求1至4任一项所述的方法，其特征在于，所述方法还包括：

6.根据权利要求5所述的方法，其特征在于，所述至少两个内核代码满足以下至少一项：所述至少两个内核代码在对应的所述硬件加速器中占用的逻辑资源的数量相同，所述至少两个内核代码在所述多个内核代码中连续。

7.一种网络模型处理方法，其特征在于，包括：

8.根据权利要求7所述的方法，其特征在于，所述地址指示信息包含偏移地址，所述方法包括：

9.根据权利要求7至8任一项所述的方法，其特征在于，若所述多个内核代码包括在所述预设顺序中位于首位的第一内核代码，且所述目标内核代码为所述第一内核代码，所述第一内核代码的执行数据包括第一输出数据，所述第一内核代码中的地址指示信息用于指示所述第一输出数据的存储地址，则所述根据所述存储地址执行所述目标内核代码，包括：

10.根据权利要求9所述的方法，其特征在于，若所述多个内核代码还包括位于所述第一内核代码与所述第二内核代码之间的第三内核代码，且所述目标内核代码为所述第三内核代码，所述第三内核代码的执行数据包括第二输入数据和第二输出数据，所述第三内核代码中的地址指示信息用于指示所述第二输入数据的存储地址和所述第二输出数据的存储地址，则所述根据所述存储地址执行所述目标内核代码，包括：

11.根据权利要求7至10任一项所述的方法，其特征在于，若所述目标内核代码为超级内核代码，所述超级内核代码包括所述多个内核代码中对应的硬件加速器类型相同的至少两个内核代码，则所述超级内核代码中的每个内核代码包含地址指示信息，所述地址指示信息用于指示所述内核代码的执行数据的存储地址，所述根据所述存储地址执行所述目标内核代码，包括：

12.根据权利要求11所述的方法，其特征在于，所述超级内核代码中的每个内核代码满足以下至少一项：所述超级内核代码中的每个内核代码在对应的所述硬件加速器中占用的逻辑资源数量相同，所述超级内核代码中的每个内核代码在所述多个内核代码中连续。

13.一种网络模型处理装置，其特征在于，包括：

14.根据权利要求13所述的装置，其特征在于，所述地址指示信息包含偏移地址，所述存储地址是根据基地址和所述偏移地址确定的。

15.根据权利要求13至14任一项所述的装置，其特征在于...

【专利技术属性】
技术研发人员：田宏民，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人