用于使用操作的混合精度分解的较高精度计算的计算机处理器制造技术

技术编号：23671832 阅读：31 留言：0更新日期：2020-04-04 17:27

本文中详述的实施例关于浮点值的算术操作。示例性处理器包括解码电路，该解码电路用于对指令解码，其中该指令指定多个操作数的位置，这些操作数的值按照浮点格式。示例性处理器进一步包括执行电路，该执行电路用于执行经解码的指令，其中执行包括：转换每个操作数的值，每个值被转换为多个较低精度的值，其中为每个操作数存储指数；在从多个操作数的值转换而来的较低精度的值之间执行算术操作；以及通过将来自算术操作的所得到的值转换为浮点格式来生成浮点值，并存储浮点值。

A computer processor for high-precision calculations using mixed precision decomposition of operations

全部详细技术资料下载

【技术实现步骤摘要】
用于使用操作的混合精度分解的较高精度计算的计算机处理器
本专利技术的实施例关于计算机处理器架构领域，更具体地关于对用于计算机处理器架构内的算术操作的值的精度转换。
技术介绍
矩阵、向量和其他多维数据集在诸如机器学习和其他批量数据处理之类的许多计算任务中正日益重要。对这些多维数据集中的浮点数据元素执行算术操作可能是资源密集型的和/或在计算上耗时的。附图说明通过参考用于示出本专利技术的实施例的以下描述和所附附图，可最佳地理解本专利技术。在附图中：图1示出根据本专利技术的一个实施例的操作：将每个值从浮点值转换为多个整数以用于算术操作，并且将来自这些算术操作的所得到的值往回重构为浮点。图2A示出根据本专利技术的一个实施例的用于将FP32值转换为三个无符号8位整数的伪代码。图2B示出根据本专利技术的一个实施例的用于将FP32值转换为两个无符号16位整数的伪代码。图2C示出根据本专利技术的一个实施例的用于将FP32值转换为三个有符号8位整数的伪代码。图2D示出根据本专利技术的一个实施例的用于将FP32值转换为四个无符号8位整数的伪代码。图2E示出根据本专利技术的一个实施例的用于从四个有符号8位整数重构FP32值的伪代码。图3示出相比先前方式使用浮点到多个整数方式的本专利技术的实施例的数据准确性。图4示出根据本专利技术的一个实施例的操作：将每个值从值转换为多个较低精度的浮点以用于算术操作，并且将来自这些算术操作的所得到的值往回重构为浮点...

【技术保护点】
1.一种处理器，包括：/n解码电路，用于对指令解码，其中，所述指令指定多个操作数的位置，所述多个操作数的值为浮点格式；以及/n执行电路，用于执行经解码的指令，所述执行包括用于：/n转换每个操作数的值，每个值被转换为多个较低精度的值，其中，将为每个操作数存储指数；/n在从所述多个操作数的值转换而来的较低精度的值之间执行算术操作；以及/n通过将来自所述算术操作的所得到的值转换为所述浮点格式来生成浮点值，并存储所述浮点值。/n

【技术特征摘要】
20180927 US 16/144,9641.一种处理器，包括：
解码电路，用于对指令解码，其中，所述指令指定多个操作数的位置，所述多个操作数的值为浮点格式；以及
执行电路，用于执行经解码的指令，所述执行包括用于：
转换每个操作数的值，每个值被转换为多个较低精度的值，其中，将为每个操作数存储指数；
在从所述多个操作数的值转换而来的较低精度的值之间执行算术操作；以及
通过将来自所述算术操作的所得到的值转换为所述浮点格式来生成浮点值，并存储所述浮点值。

2.如权利要求1所述的处理器，其中，转换操作数的值用于：
使用多个位来表示被转换为所述多个较低精度的值的每个值，所述多个位至少包括第一多个位和第二多个位；
标识所述多个位中的用于第一较低精度的值的所述第一多个位以对所述每个值进行逼近；以及
标识不与所述第一多个位重叠的用于第二较低精度的值的所述第二多个位以表示所述第一较低精度的值的所述逼近的其余部分，
其中，所述第一较低精度的值和所述第二较低精度的值用于与来自一个或多个其他操作数的较低精度的值执行所述算术操作。

3.如权利要求1或2所述的处理器，其中，转换操作数的值进一步用于：
基于值的值范围和所述多个较低精度的值来确定用于所述操作数的指数，所述多个较低精度的值各自都是整数值；以及
基于所述值范围将所述每个值量子化为整数值。

4.如权利要求3所述的处理器，其中，所述值范围基于检查所述操作数的所有值而被确定。

5.如权利要求2所述的处理器，其中，所述第一较低精度的值和所述第二较低精度的值中的每一个是较低精度的浮点值。

6.如权利要求1或2所述的处理器，其中，所述执行电路包括一个或多个专用乘法器-累加器MAC电路，并且所述一个或多个专用MAC电路用于执行整数乘法-累加操作。

7.如权利要求6所述的处理器，其中，每个MAC电路是融合乘加FMA电路。

8.如权利要求1或2所述的处理器，其中，每个操作数指定矩阵、向量、或多维张量或标量。

9.如权利要求1或2所述的处理器，其中，所述多个较低精度的值基于由所述指令指定的服务质量QoS来确定。

10.如权利要求1或2所述的处理器，其中，要执行的所述算术操作的数量基于由所述指令指定的服务质量QoS要求。

11.一种方法，包括：
对指令解码，其中，所述指令指定多个操作数的位置，所述多个操作数的值为浮点格式；以及<...

【专利技术属性】
技术研发人员：G·亨利，A·海内克，
申请(专利权)人：英特尔公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人