用于减少神经网络计算的运行时预测器制造技术

技术编号：37973175 阅读：22 留言：0更新日期：2023-06-30 09:48

本文公开了与减少执行人工神经网络(ANN)所需的计算次数相关的方法和系统。该方法包括在ANN执行期间进行的计算机实现的方法。该方法包括生成一组执行数据，生成ANN的一组神经网络数据的概要，生成ANN执行的一组执行数据的概要，使用该组神经网络数据的概要和该组执行数据的概要生成预测，以及执行复合计算。ANN的执行需要复合计算。该方法还包括抑制复合计算的一组分量计算。受抑制的一组分量计算至少部分由预测确定。部分由预测确定。部分由预测确定。

全部详细技术资料下载

【技术实现步骤摘要】
用于减少神经网络计算的运行时预测器

技术介绍

[0001]机器智能系统代表了现代计算最复杂和能量密集的计算应用之一。由于人工神经网络(ANN)代表了当今使用的大部分当前机器智能系统，因此大量的研究和开发都投入到了降低ANN执行能耗的方法上。ANN接收输入张量，使用输入张量和一组网络张量进行计算，并产生输出张量。输出张量代表了网络响应输入而生成的推断。例如，如果ANN是图像分类器，则输入可以是猫图像的编码，输出向量可以是指示图像的主题是猫的推断。这些系统如此耗费资源的原因是，它们所操作的数据结构通常非常庞大，并且必须对每个数据结构执行的离散原始计算的数量也同样巨大。
[0002]机器智能系统代表了一个具有挑战性的环境，既包括所需的计算次数，也包括为执行这些计算而必须在系统的存储器和计算区域之间移动的大型数据结构。标准ANN的网络数据通常包括数十亿个离散数据条目。基于所涉及的ANN类型，网络数据可以包括权重向量、过滤向量和各种其他类型的数据。网络数据定义了ANN，并确定对于给定的输入将提供什么输出。网络数据通常被组织成层，每层的输出作为下一层的输入。在传统的ANN中，各层是完全连接的，这要求输入向量的每个元素都参与权重向量的每个元素的计算。结果涉及的计算数量非常大。此外，ANN的输入数据、ANN的网络数据以及通过执行ANN的一层而生成的用作ANN的下一层的输入的执行数据都需要保存在存储器中，直到它们用于下一层的计算。
[0003]机器智能领域中的一个发展中的研究领域涉及一些方法，在这些方法中，可以减少从ANN生成推断所需的计算量，...

【技术保护点】

【技术特征摘要】
1.一种在神经网络执行期间进行的计算机实现的方法，包括：生成一组执行数据；生成所述神经网络的一组神经网络数据的概要；生成所述神经网络执行的一组执行数据的概要；使用所述一组神经网络数据的概要和所述一组执行数据的概要生成预测；执行复合计算，其中所述复合计算是所述神经网络的执行所需要的；以及抑制所述复合计算的一组分量计算，其中所述一组分量计算至少部分由所述预测确定。2.根据权利要求1所述的计算机实现的方法，其中：所述神经网络的执行需要执行一层所述神经网络；所述复合计算为执行一层所述神经网络所需要的；所述复合计算是矩阵乘法运算；所述一组分量计算是乘法运算；所述一组神经网络数据是该层神经网络的一组权重；以及所述一组执行数据是来自先前一层所述神经网络的一组输出数据。3.根据权利要求1所述的计算机实现的方法，进一步包括，迭代地：在执行所述复合计算之后，生成以下至少一个：(i)所述神经网络的附加神经网络数据集的附加概要；以及(ii)所述神经网络的附加执行数据集的附加概要；在生成所述附加概要之后，使用所述附加概要生成附加预测；执行附加复合计算；以及抑制所述附加复合计算的附加分量计算集，其中所述附加分量计算集至少部分由所述附加预测确定。4.根据权利要求1所述的计算机实现的方法，其中：使用第一采样操作生成所述一组神经网络数据的概要；以及使用第二采样操作生成所述一组执行数据的概要。5.根据权利要求4所述的计算机实现的方法，其中：所述第一采样操作和所述第二采样操作是平均池操作。6.根据权利要求1所述的计算机实现的方法，其中：使用预测器计算来生成所述预测，其中将所述一组神经网络数据的概要和所述一组执行数据的概要作为操作数；以及所述复合计算和所述预测器计算是同一类型的计算。7.根据权利要求6所述的计算机实现的方法，进一步包括：评估所述预测以确定所述复合计算的一组显著输出；其中所述一组显著输出由所述复合计算的一组显著分量计算生成；以及其中所述一组分量计算和所述一组显著分量计算是互斥的。8.根据权利要求7所述的计算机实现的方法，其中：所述评估使用top
‑
K运算来选择所述一组显著输出。9.根据权利要求6所述的计算机实现的方法，进一步包括：评估所述预测以确定所述复合计算的一组显著输出；
使用所述一组显著输出从所述一组神经网络数据中确定一组显著神经网络数据；以及其中所述抑制抑制所述复合计算中不使用所述一组显著神经网络数据的分量计算。10.根据权利要求9所述的计算机实现的方法，其中：所述评估使用top
‑
K运算来选择所述一组显著输出；所述一组显著神经网络数据的确定使用所述一组执行数据的概要的转置。11.根据权利要求6所述的计算机实现的方法，进一步包括：评估所述预测以确定所述复合计算的一组显著输出；使用所述一组显著输出从所述一组执行数据中确定一组显著执行数据；以及其中所述抑制抑制所述复合计算中不使用所述一组显著执行数据的分量计算。12.根据权利要求11...

【专利技术属性】
技术研发人员：L，
申请(专利权)人：滕斯托伦特股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人