神经网络模型的编译方法、装置、电子设备和存储介质制造方法及图纸

技术编号：33622549 阅读：15 留言：0更新日期：2022-06-02 00:47

本公开实施例公开了一种神经网络模型的编译方法、装置、电子设备和存储介质，其中，方法包括：确定待编译神经网络模型在预设网络层对应的中间表示；基于中间表示，确定第一目标层；基于预设运算，对第一目标层的第一输入张量和第二输入张量进行处理，得到第一目标层对应的第一处理层；预设运算至少包括卷积运算；基于第一目标层对应的第一处理层，获得中间表示对应的优化模型；将优化模型编译为待编译神经网络模型对应的二进制的目标模型。本公开实施例基于卷积运算实现按元素取最大值及按元素取最小值运算，使得神经网络模型的按元素取最大值及按元素取最小值运算能够通过加速器硬件实现，有效提高模型推理速度，从而提高数据处理效率。据处理效率。据处理效率。

全部详细技术资料下载

【技术实现步骤摘要】
神经网络模型的编译方法、装置、电子设备和存储介质

[0001]本公开涉及人工智能技术，尤其是一种神经网络模型的编译方法、装置、电子设备和存储介质。

技术介绍

[0002]随着人工智能的飞速发展，一系列轻量级神经网络模型逐渐被用在手机、PC(个人计算机)、车载设备等移动终端上，以实现物体检测、分类等机器学习任务。在这些神经网络模型中，有一些模型会包含按元素取最值层，比如按元素取最大值层(即elementwise min层)、按元素取最小值层(即elementwise max层)，需要对该层的两个输入张量进行按元素取最小值或按元素取最大值，为了提高神经网络的推理速度，通常采用专门加速芯片(或加速器)来实现神经网络的运算，但是现有的加速芯片通常不支持按元素取最值运算，导致模型数据处理效率较低。因此，如何基于芯片实现按元素取最值运算，以进一步提高神经网络的推理速度，成为一种亟需解决的技术问题。

技术实现思路

[0003]为了解决上述加速芯片不支持按元素取最值运算的技术问题，提出了本公开。本公开的实施例提供了一种神经网络模型的编译方法和装置、电子设备和存储介质。
[0004]根据本公开实施例的一个方面，提供了一种神经网络模型的编译方法，包括：确定待编译神经网络模型在预设网络层对应的中间表示；基于所述中间表示，确定第一目标层；基于预设运算，对所述第一目标层的第一输入张量和第二输入张量进行处理，得到所述第一目标层对应的第一处理层；所述预设运算至少包括卷积运算；基于所述第一目标层对应的所述第一处理层，获得所述...

【技术保护点】

【技术特征摘要】
1.一种神经网络模型的编译方法，包括：确定待编译神经网络模型在预设网络层对应的中间表示；基于所述中间表示，确定第一目标层；基于预设运算，对所述第一目标层的第一输入张量和第二输入张量进行处理，得到所述第一目标层对应的第一处理层；所述预设运算至少包括卷积运算；基于所述第一目标层对应的所述第一处理层，获得所述中间表示对应的优化模型；将所述优化模型编译为所述待编译神经网络模型对应的二进制的目标模型。2.根据权利要求1所述的方法，其中，所述预设运算包括第一卷积运算、第一按元素相加运算、第二卷积运算和第二按元素相加运算；所述基于预设运算，对所述第一目标层的第一输入张量和第二输入张量进行处理，得到所述第一目标层对应的第一处理层，包括：对所述第二输入张量进行第一卷积运算，获得第一结果；对所述第一结果与所述第一输入张量进行第一按元素相加运算，获得第二结果；对所述第二结果进行第二卷积运算，获得第三结果；对所述第三结果与所述第二输入张量或所述第一输入张量进行第二按元素相加运算，获得第四结果；将所述第四结果作为所述第一目标层对应的输出结果，得到所述第一目标层对应的所述第一处理层。3.根据权利要求1所述的方法，其中，所述第一目标层为按元素取最大值层；所述基于预设运算，对所述第一目标层的第一输入张量和第二输入张量进行处理，得到所述第一目标层对应的第一处理层，包括：基于第一预设卷积核及第一偏置参数对所述第二输入张量进行卷积运算，获得所述第二输入张量对应的第一张量；所述第一偏置参数根据所述第二输入张量的特征元素所属的数值类型的取值范围及第一规则确定；将所述第一张量与所述第一输入张量进行按元素相加运算，获得第二张量；基于第二预设卷积核及第二偏置参数对所述第二张量进行卷积运算，获得所述第二张量对应的第三张量，所述第二偏置参数根据所述第二输入张量的特征元素所属的数值类型的取值范围及第二规则确定；将所述第三张量与所述第二输入张量进行按元素相加运算，获得第四张量；将所述第四张量作为所述第一输入张量和所述第二输入张量的按元素取最大值的结果，得到所述第一目标层对应的所述第一处理层。4.根据权利要求1所述的方法，其中，所述第一目标层为按元素取最小值层；所述基于预设运算，对所述第一目标层的第一输入张量和第二输入张量进行处理，得到所述第一目标层对应的第一处理层，包括：基于第三预设卷积核及第三偏置参数对所述第二输入张量进行卷积运算，获得所述第二输入张量对应的第五张量；所述第三偏置参数根据所述第二输入张量的特征元素所属的数值类型的取值范围及第三规则确定；将所述第五张量与所述第一输入张量进行按元素相加运算，获得第六张量；基于第四预设卷积核及第四偏置参数对...

【专利技术属性】
技术研发人员：邓博文，李德林，
申请(专利权)人：北京地平线机器人技术研发有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人