当前位置: 首页 > 专利查询>辉达公司专利>正文

用于修剪神经网络的技术制造技术

技术编号:32509020 阅读:30 留言:0更新日期:2022-03-02 10:48
本发明专利技术公开了用于修剪神经网络的技术,具体公开了用于减小神经网络的大小的装置、系统和技术。在至少一个实施例中,通过至少移除神经网络的一个或更多个神经元和调整神经网络的一个或更多个层以补偿所移除的一个或更多个神经元,来减小神经网络的大小。来减小神经网络的大小。来减小神经网络的大小。

【技术实现步骤摘要】
用于修剪神经网络的技术


[0001]至少一个实施例涉及用于执行和促进人工智能的处理资源。例如,至少一个实施例涉及用于根据本文描述的各种新型技术来修剪神经网络的处理器或计算系统。

技术介绍

[0002]训练神经网络和利用神经网络执行推理可使用大量的存储器、时间或计算资源。用于训练神经网络并用神经网络执行推理的存储器、时间或计算资源的量可被改进。
附图说明
[0003]图1是根据至少一个实施例的示出用于修剪神经网络并使用经修剪的神经网络进行推理的系统的框图;
[0004]图2是根据至少一个实施例的示出神经网络修剪器的框图;
[0005]图3示出了根据至少一个实施例的生成经修剪的神经网络的表示的技术的流程图;
[0006]图4示出了根据至少一个实施例的修剪神经网络的技术的流程图;
[0007]图5示出了根据至少一个实施例的传播偏置项的技术的流程图;
[0008]图6示出了根据至少一个实施例的使用经修剪的神经网络进行推理的技术的流程图;
[0009]图7A示出了根据至少一个实施例的推理和/本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种处理器,包括:一个或更多个电路,用于通过至少移除神经网络的一个或更多个神经元并调整所述神经网络的一个或更多个层以补偿移除的一个或更多个神经元,来减小所述神经网络的大小。2.根据权利要求1所述的处理器,其中调整所述神经网络的一个或更多个层包括:将所述移除的一个或更多个神经元的一个或更多个偏置项传播到后续层。3.根据权利要求2所述的处理器,其中传播一个或更多个偏置项包括:计算一个或更多个偏置项的一个或更多个激活函数结果。4.根据权利要求1所述的处理器,其中移除一个或更多个神经元包括:识别所述神经网络的表示中的零权重的神经元,以及移除所述零权重的神经元。5.根据权利要求1所述的处理器,其中调整所述神经网络的一个或更多个层包括:确定移除一个或更多个神经元将导致在具有不同长度的操作数的层之间执行的逐元素运算,以及插入一个或更多个分散运算以生成用于所述逐元素运算的相等长度的操作数。6.根据权利要求1所述的处理器,其中所述一个或更多个电路还用于:导入所述神经网络的第一表示;以及导出大小减小的神经网络的第二表示。7.根据权利要求1所述的处理器,其中调整所述神经网络的一个或更多个层包括:识别所述神经网络的第一层的第一类型;识别所述神经网络的第二层的第二类型,其中所述第二层在所述第一层之后;以及至少部分地基于识别出的第一类型和第二类型来调整所述第二层。8.根据权利要求7所述的处理器,其中所述第一类型是全连接的。9.一种机器可读介质,具有存储在其上的指令的集合,所述指令如果由一个或更多个处理器执行,则使所述一个或更多个处理器至少:通过至少移除神经网络的一个或更多个神经元并调整所述神经网络的一个或更多个层以补偿修剪掉的一个或更多个神经元,来修剪所述神经网络。10.根据权利要求9所述的机器可读介质,其中调整所述神经网络的一个或更多个层包括:将移除的一个或更多个神经元的一个或更多个偏置项传播到后续层。11.根据权利要求10所述的机器可读介质,其中传播一个或更多个偏置项包括:计算一个或更多个偏置项的一个或更多个激活函数。12.根据权利要求9所述的机器可读介质,其中移除一个或更多个神经元包括:识别所述神经网络的表示中的零权重的神经元,以及移除所述零权重的神经元。13.根据权利要求9所述的机器可读介质,其中调整所述神经网络的一个或更多个层包括:确定移除一个或更多个神经元将导致在具有不同长度的操作数的层之间执行的逐元素运算,以及插入一个或更多个分散运算以生成用于所述逐元素运算的相等长度的操作数。14.根据权利要求9所述的机器可读介质,其中所述指令如果由所述一个或更多个处理器执行,进一步使所述一个或更多个处理器:导入所述神经网络的第一表示;以及导出经修剪的神经网络的第二表示。15.根据权利要求14所述的机器可读介质,其中所述神经网络的所述第一表示是根据
开放神经网络交换ONNX格式存储的第一神经网络模型,并且所述经修剪的神经网络的所述第二表示是根据ONNX格式存储的第二神经网络模型。16.一种方法,包括:通过至少移除神经网络的一个或更多个神经元并调整所述神经网络的一个或更多个层以补偿移除的一个或更多个神经元,来减小所述神经网络的大小。17.根据权利要求16所述的方法,其中调整所述神经网络的一个或更多个层包括:将所述移除的一个或更多个神经元的一个或更多个偏置项传播到后续层。18.根据权利要求17所述的方法,其中传播一个或更多个偏置项包括:计算一个或更多个偏置项的一个或更多个激活函数结果,以及至少部分地基于...

【专利技术属性】
技术研发人员:D
申请(专利权)人:辉达公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1