指令生成方法、装置及电子设备制造方法及图纸

技术编号:38209934 阅读:22 留言:0更新日期:2023-07-21 17:00
公开了一种指令生成方法的方法、装置及电子设备,涉及集成电路技术领域,该方法包括确定神经网络模型中的第一函数算子;确定人工智能加速器所支持的硬件参数;根据硬件参数,确定人工智能加速器所支持的函数算子;基于人工智能加速器所支持的函数算子与第一函数算子之间的包含关系,在预设函数映射关系中确定第一函数算子对应的硬件参数支持的目标函数算子;根据目标函数算子,生成人工智能加速器可执行的指令。本公开的技术方案在生成人工智能加速器可执行的指令时,考虑了人工智能加速器的硬件参数以及第一函数算子对应的目标函数算子,从而使得人工智能加速器能够支持对输入特征数据进行第一函数算子的运算。特征数据进行第一函数算子的运算。特征数据进行第一函数算子的运算。

【技术实现步骤摘要】
指令生成方法、装置及电子设备


[0001]本公开涉及集成电路
,尤其涉及一种指令生成方法、装置及电子设备。

技术介绍

[0002]随着人工智能加速器的不断更新,人工智能加速器原生支持的算子也更加丰富。例如,人工智能加速器原生支持的算子有卷积算子、池化算子、下采样算子以及全连接算子等多个算子。

技术实现思路

[0003]通常,人工智能加速器用于运行神经网络模型。由于神经网络模型所涉及的算子类型很多,可能涉及一些特殊的算子,例如,hard_tanh(x)激活函数。而人工智能加速器原生支持的算子有限,所以神经网络模型中可能存在人工智能加速器无法原生支持的算子,因此,如何运行无法原生支持的算子是人工智能加速器亟需解决的问题。
[0004]为了解决上述技术问题,提出了本公开。本公开的实施例提供了一种指令生成方法、装置及电子设备。在生成人工智能加速器可执行的指令时,充分考虑了人工智能加速器的硬件参数、人工智能加速器支持的函数算子以及人工智能加速器支持的函数算子和第一函数算子的包含关系,因此生成的可执行指令能够实现对输入特征数据进行第一函数算子的运算。即本申请能够在不改变人工智能加速器的硬件参数的情况下,使人工智能加速器能够实现对输入特征数据进行第一函数算子的运算,从而提高了人工智能加速器针对输入特征数据的运算效率。
[0005]根据本公开的一个方面,提供了一种用于人工智能加速器进行指令生成方法,包括:首先,确定神经网络模型中的第一函数算子;其次,确定人工智能加速器所支持的硬件参数;接着根据硬件参数,确定人工智能加速器所支持的函数算子;之后,基于人工智能加速器所支持的函数算子与第一函数算子之间的包含关系,在预设函数映射关系中确定第一函数算子对应的硬件参数支持的目标函数算子;最后,根据目标函数算子,生成人工智能加速器可执行的指令。
[0006]基于本方案,通过根据人工智能加速器的硬件参数,确定人工智能加速器所支持的函数算子。结合人工智能加速器所支持的函数算子和第一函数算子的包含关系,在预设函数映射关系中确定第一函数算子对应的目标函数算子。最后利用该目标函数算子,生成人工智能加速器可执行的指令。由于预设函数映射关系中包括第一函数算子对应的目标函数算子,相当于将第一函数算子转化为目标函数算子,并且转化后的目标函数算子为人工智能加速器支持的函数算子,之后再利用目标函数算子生成可执行指令。人工智能加速器可以通过执行该可执行指令,从而实现对输入特征数据进行第一函数算子的运算。
[0007]根据本申请的一个方面,提供了一种通过人工智能加速器对输入特征数据进行处理的方法,包括:确定需要对输入特征数据进行处理的至少一个运算指令;根据至少一个运算指令,对输入特征数据进行处理,得到输入特征数据对应的输出特征数据。
[0008]基于本方案,通过确定至少一个运算指令,并根据至少一个运算指令对输入特征数据进行处理,得到输入特征数据对应的输出特征数据,能够使得人工智能加速器实现对输入特征数据进行第一函数算子的运算,提高了人工智能加速器针对输入特征数据的运算效率。
[0009]根据本公开的一个方面,提供了用于人工智能加速器的指令生成的装置,包括:第一确定模块,用于确定神经网络模型中的第一函数算子;第二确定模块,用于确定人工智能加速器所支持的硬件参数;第三确定模块,用于根据硬件参数,确定人工智能加速器所支持的函数算子;查询模块,用于基于人工智能加速器所支持的函数算子与第一函数算子之间的包含关系,在预设函数映射关系中确定第一函数算子对应的硬件参数支持的目标函数算子;指令生成模块,用于根据目标函数算子,生成人工智能加速器可执行的指令。
[0010]根据本公开的一个方面,提供了用于通过人工智能加速器对输入特征数据进行处理的装置,包括:确定模块,用于确定需要对输入特征数据进行处理的至少一个运算指令;处理模块,用于根据至少一个运算指令,对输入特征数据进行处理,得到输入特征数据对应的输出特征数据。
[0011]根据本公开的一个方面,提供了一种计算机可读存储介质,存储介质存储有计算机程序,计算机程序用于执行上述任一的方法。
[0012]根据本公开的一个方面,提供了一种电子设备,该电子设备包括:处理器;用于存储处理器可执行指令的存储器;处理器,用于从存储器中读取可执行指令,并执行指令以实现上述任一的方法。
附图说明
[0013]通过结合附图对本公开实施例进行更详细的描述,本公开的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本公开实施例的进一步理解,并且构成说明书的一部分,与本公开实施例一起用于解释本公开,并不构成对本公开的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
[0014]图1是本申请一示例性实施例提供的一种电子设备的结构示意图。
[0015]图2是本申请一示例性实施例提供的另一种电子设备的结构示意图。
[0016]图3是本申请一示例性实施例提供的用于人工智能加速器的指令生成方法的流程示意图之一。
[0017]图4是本公开一示例性实施例提供的用于人工智能加速器的指令生成方法的流程示意图之二。
[0018]图5是本公开一示例性实施例提供的用于人工智能加速器的指令生成方法的流程示意图之三。
[0019]图6是本公开一示例性实施例提供的一种卷积运算示意图之一。
[0020]图7是本公开一示例性实施例提供的一种卷积运算示意图之二。
[0021]图8是本公开一示例性实施例提供的一种基于目标函数算子进行卷积运算的过程示意图。
[0022]图9是本公开一示例性实施例提供的用于人工智能加速器的指令生成方法的流程示意图之四。
[0023]图10是本公开一示例性实施例提供的用于人工智能加速器的指令生成方法的流程示意图之五。
[0024]图11是本公开一示例性实施例提供的另一种基于目标函数算子进行卷积运算的过程示意图。
[0025]图12是本公开一示例性实施例提供的通过人工智能加速器对输入特征数据进行处理的方法的流程示意图之一。
[0026]图13是本公开一示例性实施例提供的通过人工智能加速器对输入特征数据进行处理的方法的流程示意图之二。
[0027]图14是本公开一示例性实施例提供的通过人工智能加速器对输入特征数据进行处理的方法的流程示意图之三。
[0028]图15是本申请一示例性实施例提供的通过人工智能加速器对输入特征数据进行处理的方法的流程示意图之四。
[0029]图16是本申请一示例性实施例提供的一种用于人工智能加速器的指令生成装置的结构图。
[0030]图17是本申请一示例性实施例提供的一种通过人工智能加速器对输入特征数据进行处理的装置的结构图。
[0031]图18是本申请一示例性实施例提供的一种电子设备的结构图。
具体实施方式
[0032]下面,将参考附图详细地描述根据本公开的示例实施例。显然,所描述的实施例仅仅是本公开的一部本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于人工智能加速器的指令生成方法,包括:确定神经网络模型中的第一函数算子;确定所述人工智能加速器所支持的硬件参数;根据所述硬件参数,确定所述人工智能加速器所支持的函数算子;基于所述人工智能加速器所支持的函数算子与所述第一函数算子之间的包含关系,在预设函数映射关系中确定所述第一函数算子对应的所述硬件参数支持的目标函数算子;根据所述目标函数算子,生成所述人工智能加速器可执行的指令。2.根据权利要求1所述的方法,其中,所述根据所述目标函数算子,生成所述人工智能加速器可执行的指令,包括:确定所述人工智能加速器支持的饱和运算的饱和范围;基于所述人工智能加速器支持的饱和运算的饱和范围,确定所述目标函数算子对应的转换参数;根据所述目标函数算子和所述目标函数算子对应的转换参数,生成所述人工智能加速器可执行的指令。3.根据权利要求2所述的方法,其中,所述基于所述人工智能加速器支持的饱和运算的饱和范围,确定所述目标函数算子对应的转换参数,包括:基于所述饱和运算的饱和范围,确定位宽参数;确定所述神经网络模型的移位参数;基于所述移位参数和位宽参数的大小关系,确定所述目标函数算子对应的转换参数。4.根据权利要求2所述的方法,其中,所述基于所述人工智能加速器支持的饱和运算的饱和范围,确定所述目标函数算子对应的转换参数,包括:基于所述第一函数算子的激活范围以及所述人工智能加速器支持的饱和运算的饱和范围,确定所述目标函数算子中的第二函数算子对应的第一偏置参数、所述目标函数算子中的第三函数算子对应的第二偏置参数,以及所述目标函数算子中的第四函数算子对应的第三偏置参数;其中,所述目标函数算子对应的转换参数包括所述第一偏置参数、所述第二偏置参数和所述第三偏置参数。5.根据权利要求4所述的方法,其中,所述根据所述目标函数算子和所述目标函数算子对应的转换参数,生成所述人工智能加速器可执行的指令,包括:根据所述第二函数算子的运算指令类型和所述第一偏置参数,生成所述人工智能加速器可执行的第一运算指令;根据所述第三函数算子的运算指令类型和所述第二偏置参数,生成所述人工智能加速器可执行的第二运算指令;根据所述第四函数算子的运算指令类型和所述第三偏置参数,生成所述人工智能加速器可执行的第三运算指令。6.一种通过人工智能加速器对输入特征数据进行处理的方法,包括:确定需要对输入特征数据进行处理的至少一个运算指令;根据所述至少一个运算指令,对所述输入特征数据进行处理,得到所述输入特征数据对应的输出特征数据。
7.根据权利要求6所述的方法,其中,所述根据所述至少一个运算指令,对所述输入特征数据进行处理,得...

【专利技术属性】
技术研发人员:李德林
申请(专利权)人:北京地平线信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1