【技术实现步骤摘要】
用于神经网络的高精度矩阵乘法
[0001]至少一个实施例涉及用于执行和促进人工智能的处理资源。例如,至少一个实施例涉及用于根据本文描述的各种新技术训练神经网络的处理器或计算系统。
技术介绍
[0002]诸如可能涉及矩阵乘法的各种数学运算依赖于高精度数据。在许多情况下,这些运算用于对时间敏感的运算。虽然可以使用加速的硬件来执行这些运算,但该硬件可能具有有限的精度,或者可能只能支持比输入数据可用的精度低的精度的值。在前的尝试允许将高精度的值分解为较低精度的值,然后在执行运算后尝试恢复较高的精度,但这些方法可能会失去至少某些值或值的范围的精度,因此不会产生可靠、高精度的结果。
附图说明
[0003]根据本公开的各种实施例将参照附图进行描述,其中:
[0004]图1A和图1B示出了根据至少一个实施例的值分解;
[0005]图2A、图2B、图2C和图2D示出了根据至少一个实施例的矩阵乘法运算的误差区域;
[0006]图3示出了根据至少一个实施例的具有矩阵乘法的值分解;
[0007]图4A和图4B示出了根据至少一个实施例的用于对较高的精度数据执行较低的精度运算的过程;
[0008]图5示出了根据至少一个实施例的用于执行数学运算的系统的组件;
[0009]图6A示出了根据至少一个实施例的推理和/或训练逻辑;
[0010]图6B示出了根据至少一个实施例的推理和/或训练逻辑;
[0011]图7示出了根据至少一个实施例的示例数据中心系统;
[0012 ...
【技术保护点】
【技术特征摘要】
1.一种处理器,包括:一个或更多个电路,用于对一个或更多个经缩放精度的运算数执行一个或更多个矩阵数学运算,以及用于生成一个或更多个未缩放精度的结果,所述一个或更多个未缩放精度的结果具有比所述一个或更多个经缩放精度的运算数更高的精度。2.根据权利要求1所述的处理器,其中所述一个或更多个电路用于通过对具有所述更高的精度的一个或更多个输入值执行一个或更多个分解运算来确定所述一个或更多个经缩放精度的运算数。3.根据权利要求2所述的处理器,其中所述一个或更多个电路进一步用于对各个输入值执行多个分解,其中相应的分解包括将先前值舍入为分解值,从所述先前值减去所述分解值以获取差值,然后将缩放因子应用于所述差值。4.根据权利要求3所述的处理器,其中所述一个或更多个电路进一步用于使用来自所述多个分解中的每一者的所述分解值来执行所述一个或更多个矩阵数学运算。5.根据权利要求3所述的处理器,其中所述一个或更多个电路进一步用于将逆缩放因子应用于所述一个或更多个矩阵数学运算的一个或更多个结果,以生成具有所述更高的精度的所述一个或更多个未缩放精度的结果。6.根据权利要求1所述的处理器,其中所述缩放因子被应用到用于所述一个或更多个矩阵数学运算的数学方程的一项或更多项,并且其中所述缩放因子是用于所述一个或更多个矩阵数学运算的多个缩放因子中的一者。7.一种系统,包括:一个或更多个处理器,用于对一个或更多个经缩放精度的运算数执行一个或更多个矩阵数学运算,以及用于生成一个或更多个未缩放精度的结果,所述一个或更多个未缩放精度的结果具有比所述一个或更多个经缩放精度的运算数更高的精度。8.根据权利要求7所述的系统,其中所述一个或更多个处理器进一步用于通过对具有所述更高的精度的一个或更多个输入值执行一个或更多个分解运算来确定所述一个或更多个经缩放精度的运算数。9.根据权利要求8所述的系统,其中所述一个或更多个处理器进一步用于对各个输入值执行多个分解,其中相应的分解包括将先前值舍入为分解值,从所述先前值减去所述分解值以获取差值,然后将缩放因子应用于所述差值。10.根据权利要求9所述的系统,其中所述一个或更多个处理器进一步用于使用来自所述多个分解中的每一者的所述分解值来执行所述一个或更多个矩阵数学运算。11.根据权利要求9所述的系统,其中所述一个或更多个处理器进一步用于将逆缩放因子应用于所述一个或更多个矩阵数学运算的一个或更多个结果,以生成具有所述更高的精度的所述一个或更多个未缩放精度的结果。12.根据权利要求7所述的系统,其中所述缩放因子被应用到用于所述一个或更多个矩阵数学运算的数学方程的一项或更多项,并且其中所述缩放因子是用于所述一个或更多个矩阵数学运算的多个缩放因子中的一者。13.一种方法,包括:对一个或更多个经缩放精度的运算数执行一个或更多个矩阵数学运算;以及生成一个或更多个未经缩放精度的结果,所述一个或更多个未经缩放精度的结果具有
比所述一个或更多个经缩放精度的运算数更高的精度。14.根据权利要求13所述的方法,进一步包括:通过对具有所述更高的精度的一个或更多个输入值执行一个或更多个分解运算来确定所述一个或更多个经缩放精度的运算数。15.根据权利要求14所述的方法,进一步包括:对各个输入值执行多个分解,其中相应的分解包括将先前值舍入为分解值,从所述先前值中减去所述分解值以获取差值,然后将缩放因子应用于所述差值。16.根据权利要求15所述的方法,进一步包括:使用来自所述多个分解中的每一者的所述分解值来执行所述一个或更多个矩阵数学运算。...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。