量化神经网络训练与推理制造技术

技术编号：36738966 阅读：18 留言：0更新日期：2023-03-04 10:13

本公开涉及量化神经网络训练与推理。用于处理神经网络的计算机实现的方法的一个实施例包括接收对应于多维输入张量的一部分并且已经基于第一比例因子量化的第一量化矩阵；以及使用所述第一量化矩阵和所述第一比例因子执行一个或更多个计算操作，以生成与多维输出张量的第一部分相对应的一个或更多个数据值。张量的第一部分相对应的一个或更多个数据值。张量的第一部分相对应的一个或更多个数据值。

全部详细技术资料下载

【技术实现步骤摘要】
量化神经网络训练与推理
[0001]相关申请的交叉引用
[0002]本申请要求于2021年8月27日提交的、序列号为63/238,036的美国临时专利申请的优先权，其标题为“TECHNIQUES FOR QUANTIZED FIXED
‑
POINT TRAINING WITH FINE
‑
GRAINED SCALING AND ADAPTIVE PRECISION”。该相关申请的主题通过引用并入本文。

[0003]本公开的实施例总体上涉及计算机科学和人工智能，更具体地，涉及用于量化神经网络训练和推理的技术。

技术介绍

[0004]深度神经网络通常包括许多计算量大的层，例如卷积层和/或全连接层。深度神经网络通常也使用全精度算法(例如，使用32位浮点数据)进行训练和部署。因此，执行深度神经网络可能涉及大量的计算复杂性、延迟和内存消耗。为了减少与深度神经网络相关的处理时间和内存占用，可以量化神经网络的权重和/或激活。例如，用于权重和/或激活的32位浮点数据值可以映射到16位浮点数据值或8位整数数据值，这减少了所述数据值的位宽。反过来，减小数据值的位宽可以降低训练和部署深度神经网络时所执行的不同计算(例如矩阵乘法运算)的复杂度，以及存储所述数据值所需的内存量。
[0005]通常，为了量化神经网络的权重和激活，将比例因子应用于表示权重的权重张量以及表示激活的激活张量。然而，由于相同的比例因子在给定张量的许多维度上共享，因此缩放张量中各个元素的精度降低，从而增加了量化引...

【技术保护点】

【技术特征摘要】
1.一种用于处理神经网络的计算机实现的方法，所述方法包括：接收第一量化矩阵，所述第一量化矩阵对应于多维输入张量的一部分并且已经基于第一比例因子被量化；以及使用所述第一量化矩阵和所述第一比例因子执行一个或更多个计算操作，以生成与多维输出张量的第一部分相对应的一个或更多个数据值。2.根据权利要求1所述的计算机实现的方法，还包括：接收第二量化矩阵，所述第二量化矩阵对应于第二多维输入张量的一部分并且已经基于第二比例因子被量化；其中执行所述一个或更多个计算操作还包括：使用所述第二量化矩阵和所述第二比例因子来生成所述一个或更多个数据值。3.根据权利要求2所述的计算机实现的方法，其中，执行所述一个或更多个计算操作包括：使用所述第一量化矩阵和所述第二量化矩阵计算一个或更多个点积值。4.根据权利要求2所述的计算机实现的方法，其中，执行所述一个或更多个计算操作包括：使用所述第一比例因子和所述第二比例因子对一个或更多个点积值中包括的每个点积值进行缩放。5.根据权利要求1所述的计算机实现的方法，其中，所述第一量化矩阵包括转置矩阵。6.根据权利要求1所述的计算机实现的方法，其中，所述第一量化矩阵被包括在多个量化矩阵中，其中，所述多个量化矩阵中包括的每个量化矩阵对应于所述多维输入张量的不同部分并已使用不同的比例因子进行了量化。7.根据权利要求6所述的计算机实现的方法，其中，执行所述一个或更多个计算操作进一步包括：对于包括在所述多个量化矩阵中的每个量化矩阵，使用所述量化矩阵和关联的比例因子来生成一个或更多个关联数据值，所述一个或更多个关联数据值对应于所述多维输出张量的不同部分。8.根据权利要求1所述的计算机实现的方法，还包括：基于与所述多维输出张量相关联的第二比例因子来缩放所述多维输出张量。9.根据权利要求1所述的计算机实现的方法，还包括：通过将所述多维输出张量细分为多个矩阵并量化包括在所述多个矩阵中的每个矩阵来量化所述多维输出张量。10.根据权利要求1所述的计算机实现的方法，还包括：通过以下方式量化所述多维输出张量：针对包括所述多维输出张量的多个矩阵中包括的每个矩阵，基于所述矩阵中包括的一个或更多个数据值来计算对应的比例因子；以及基于所述对应的比例因子量化包括在所述多个矩阵中的每个矩阵。11.一种或更多种非暂时性计算机可读介质，其存储指令，所述指令在由一个或更多个处理器执行时，使所述一个或更多个处理器执行以下步骤：接收第一量化矩阵，所述第一量化矩阵对应于多维输入张量的一部分并且已经基于第一比例因子被量化；以及使用所述第一量化矩阵和所述第一比例因子执行一个或更多个计算操作，以生成与多维输出张量的第一部分相对应的一个或更多个数据值。12.根据权利要求11所述的一种或...

【专利技术属性】
技术研发人员：T，
申请(专利权)人：辉达公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人