神经网络模型的编译方法、装置、存储介质及电子设备制造方法及图纸

技术编号：37070174 阅读：18 留言：0更新日期：2023-03-29 19:47

公开了一种神经网络模型的编译方法、装置、存储介质及电子设备。该方法包括：获取待编译神经网络模型，待编译神经网络模型包括所对应的运算类型为第一运算的第一网络层，第一运算为修正线性单元(ReLU)运算的变体；基于第一网络层的层参数，将第一网络层的输入特征图的第一运算变换为第二运算，得到第二网络层，第二运算为神经网络加速器支持的运算；基于待编译神经网络模型中除第一网络层之外的网络层，以及第二网络层，通过编译处理生成目标神经网络模型。本公开的实施例能够在不进行数据搬移的前提下实现ReLU运算的变体，由此能够有效地节约带宽和时间，降低ReLU运算的变体的实现成本，同时还能够避免占用额外资源。同时还能够避免占用额外资源。同时还能够避免占用额外资源。

全部详细技术资料下载

【技术实现步骤摘要】
神经网络模型的编译方法、装置、存储介质及电子设备

[0001]本公开涉及人工智能技术，尤其是一种神经网络模型的编译方法、装置、存储介质及电子设备。

技术介绍

[0002]在一些情况下，芯片上部署的神经网络加速器不支持修正线性单元(Rectified linear unit，ReLU)运算的变体，而实际应用中存在某些神经网络模型运行时需要进行ReLU运算的变体，针对这种情况，目前的解决措施是：将需要进行ReLU运算的变体的数据搬移至中央处理器(Central Processing Unit，CPU)进行处理，再将CPU处理后得到的结果搬移回神经网络加速器，然而，这种解决措施中由于需要进行数据搬移，存在浪费带宽和时间，成本高的问题。

技术实现思路

[0003]为了解决上述技术问题，提出了本公开。本公开的实施例提供了一种神经网络模型的编译方法、装置、存储介质及电子设备。
[0004]根据本公开实施例的一个方面，提供了一种神经网络模型的编译方法，包括：
[0005]获取待编译神经网络模型，所述待编译神经网络模型包括所对应的运算类型为第一运算的第一网络层，所述第一运算为修正线性单元运算的变体；
[0006]基于所述第一网络层的层参数，将所述第一网络层的输入特征图的所述第一运算变换为第二运算，得到第二网络层，所述第二运算为神经网络加速器支持的运算；
[0007]基于所述待编译神经网络模型中除所述第一网络层之外的网络层，以及所述第二网络层，通过编译处理生成目标神经网络模型。
...

【技术保护点】

【技术特征摘要】
1.一种神经网络模型的编译方法，包括：获取待编译神经网络模型，所述待编译神经网络模型包括所对应的运算类型为第一运算的第一网络层，所述第一运算为修正线性单元运算的变体；基于所述第一网络层的层参数，将所述第一网络层的输入特征图的所述第一运算变换为第二运算，得到第二网络层，所述第二运算为神经网络加速器支持的运算；基于所述待编译神经网络模型中除所述第一网络层之外的网络层，以及所述第二网络层，通过编译处理生成目标神经网络模型。2.根据权利要求1所述的方法，其中，所述第一网络层的层参数中包括C个参数，C为所述输入特征图的通道数；所述基于所述第一网络层的层参数，将所述第一网络层的输入特征图的所述第一运算变换为第二运算，包括：分别确定所述C个参数中的每个参数与第一预设值两者中的较小值，得到与所述C个参数对应的C个较小值；分别确定所述C个较小值中的每个较小值与所述第一预设值两者的第一差值，得到与所述C个较小值对应的C个第一差值；基于所述C个第一差值，将所述第一网络层的输入特征图的所述第一运算变换为第二运算。3.根据权利要求2所述的方法，其中，所述基于所述C个第一差值，将所述第一网络层的输入特征图的所述第一运算变换为第二运算，包括：分别确定所述C个参数中的每个参数与所述第一预设值两者中的较大值，得到与所述C个参数对应的C个较大值；分别确定所述第一预设值与所述C个较大值中的每个较大值两者的第二差值，得到与所述C个较大值对应的C个第二差值；基于所述C个第一差值和所述C个第二差值，将所述第一网络层的输入特征图的所述第一运算变换为第二运算。4.根据权利要求3所述的方法，其中，所述基于所述C个第一差值和所述C个第二差值，将所述第一网络层的输入特征图的所述第一运算变换为第二运算，包括：基于所述C个第一差值和第二预设值，构建第一卷积核集合；基于所述C个第二差值和所述第二预设值，构建第二卷积核集合；基于C和所述第二预设值，构建第三卷积核集合；基于C、所述第二预设值和第三预设值，构建第四卷积核集合；基于所述第一卷积核集合、所述第二卷积核集合、所述第三卷积核集合和所述第四卷积核集合，将所述第一网络层的输入特征图的所述第一运算变换为第二运算。5.根据权利要求4所述的方法，其中，所述第二预设值为1，所述第三预设值为
‑
1，并且，将所述输入特征图的所述第一运算变换为所述第二运算所基于的卷积核集合满足以下至少一项：所述第一卷积核集合包括C个宽度为1、高度为1、通道数为C的卷积核，所述第一卷积核集合包括的C个卷积核中的第i个卷积核中的第i个元素为所述C个第一差值中的第i个第一差值，所述第一卷积核集合中的其余元素均为0；
所述第二卷积核集合包括C个宽度为1、高度为1、通道数为C的卷积核，所述第二卷积核集合包括的C个卷积核中的第j个卷积核中的第j个元素为所述C个第二差值中的第j个第二差值，所述第二卷积核集合中的其余元素均为0；所述第三卷积核集合包括C个宽度为1、高度为1、通道数为C的卷积核，所述第三卷积核集合包括的C个卷积核中的第s个卷积核中的第s个元素为1，所述第三卷积核集合中的其余元素均为0；所述第四卷积核集合包括C个宽度为1、高度为1、通道数为C的卷积核，所述第四卷积核集合包括的C个卷积核中的第t个卷积核中的第t个元素为
‑

【专利技术属性】
技术研发人员：李德林，王振江，李建军，
申请(专利权)人：北京地平线信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人