用于执行指令的处理器、归一化加法运算的方法、通信设备、机器可读介质、用于处理指令的设备和设备技术

技术编号：11832195 阅读：71 留言：0更新日期：2015-08-05 17:55

在一个实施例中，处理器包括至少一个浮点单元。该至少一个浮点单元可包括加法器、引导变化预测器(LCA)逻辑以及移位器。加法器可以将第一操作数X与第二操作数Y相加，以获得具有位长度n的输出操作数。LCA逻辑可以：对于从n‑1到1的每一个位位置i，基于第一操作数X和第二操作数Y，获得一组传播值以及一组位值；以及，基于该组传播值以及该组位值，生成LCA掩码。移位器可以基于LCA掩码，归一化输出操作数。描述并要求保护其他实施例。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】
技术介绍
各实施例一般涉及浮点运算。现代的处理器包括用于对数据执行运算的各种电路。此电路可包括浮点单元(FPU)，该浮点单元可包括对浮点数字执行运算的功能。例如，浮点运算可包括加法、减法、乘法、除法以及平方根。这样的浮点运算可以大量地用于某些应用中，诸如图形、游戏、科学，以及工程应用中。附图简述图1A-1B是根据一个或多个实施例的系统的框图。图2是根据一个或多个实施例的框图。图3是根据一个或多个实施例的序列。图4是根据一个或多个实施例的处理器的框图。图5是根据一个或多个实施例的多域处理器的框图。图6是包括多个核的处理器的实施例的框图。图7是根据本专利技术的一个或多个实施例的系统的框图。图8是根据本专利技术的一个或多个实施例的系统的框图。具体实施方式一般而言，浮点单元(FPU)可以表示使用三个元素(即二进制符号位、二进制编码的指数以及二进制编码的尾数)的浮点数。在类加法运算中，尾数可以被移位，以校准指数。如此处所使用的，除加法运算之外，术语“类加法”运算还包括减法运算、最小函数、最大函数，及其他，诸如整数到浮点，以及浮点到整数转换，以及双精度到单精度以及单精度到双精度转换，以及浮点比较指令。在某些情况下，由类加法运算所产生的尾数可包括引导零(在正结果的情况下)或引导1(在负结果的情况下)。通常，引导零预测器(LZA)可以与加法器并行地使用，以预测加法器的输出尾数中的...
<a href="http://www.xjishu.com/zhuanli/55/CN104823153.html" title="用于执行指令的处理器、归一化加法运算的方法、通信设备、机器可读介质、用于处理指令的设备和设备原文来自X技术">用于执行指令的处理器、归一化加法运算的方法、通信设备、机器可读介质、用于处理指令的设备和设备</a>

【技术保护点】
一种处理器，包括：至少一个浮点单元，包括：加法器，所述加法器将第一操作数X与第二操作数Y相加，以获得具有位长度n的输出操作数；引导变化预测器(LCA)逻辑，耦合到所述加法器，用于：对于所述输出操作数的从n‑1到1的每一个位位置i，获得所述第一操作数X的一组位值，并基于所述第一操作数X和所述第二操作数Y，获得一组传播值；以及基于所述传播值组以及所述位值组，生成LCA掩码；以及移位器，其耦合到所述加法器以及所述LCA逻辑，基于所述LCA掩码，归一化所述输出操作数。

【技术特征摘要】
【国外来华专利技术】2012.12.28 US 13/729,4211.一种处理器，包括：
至少一个浮点单元，包括：
加法器，所述加法器将第一操作数X与第二操作数Y相加，以获得具有
位长度n的输出操作数；
引导变化预测器(LCA)逻辑，耦合到所述加法器，用于：
对于所述输出操作数的从n-1到1的每一个位位置i，获得所述第一操作
数X的一组位值，并基于所述第一操作数X和所述第二操作数Y，获得一组
传播值；以及
基于所述传播值组以及所述位值组，生成LCA掩码；以及
移位器，其耦合到所述加法器以及所述LCA逻辑，基于所述LCA掩码，
归一化所述输出操作数。
2.如权利要求1所述的处理器，其特征在于，所述LCA逻辑包括异或非
(XNOR)门、异-或(XOR)门、与门以及或门，其中所述XOR门耦合到所
述加法器和所述XNOR门的输出，其中所述AND门耦合到所述加法器和所述
XOR门的输出，其中所述OR门耦合到所述加法器和所述AND门的输出。
3.如权利要求2所述的处理器，其特征在于，所述位值组包括所
述第一操作数X的第一位值Xi和第二位值Xi-1，其中所述XNOR门将所述第
一位值Xi和所述第二位值Xi-1，作为输入。
4.如权利要求1所述的处理器，其特征在于，所述传播值组包括对应于
Xi XOR Yi的第一传播值Pi，对应于值Xi+1XOR Yi+1的第二传播值pi+1，以及
对应于值Xi-1XOR Yi-1的第三传播值Pi-1。
5.如权利要求4所述的处理器，其特征在于，所述XOR门从所述加法器
接收所述第二传播值pi+1作为输入，其中所述AND门从所述加法器接收所述
第三传播值Pi-1的逆作为输入，其中所述OR门从所述加法器接收所述第一传
播值Pi作为输入。
6.如权利要求1所述的处理器，其特征在于，所述LCA逻辑与所述加法
器并行地操作，其中所述移位器在第一时间点接收所述LCA掩码，其中所述

\t移位器在第二时间点接收所述输出操作数，其中所述第一时间点等于或早于所
述第二时间点。
7.如权利要求1所述的处理器，其特征在于，所述LCA掩码包括，对于
所述输出操作数中的每一个引导1或0，第一值位。
8.如权利要求7所述的处理器，其特征在于，所述LCA掩码进一步包括
对应于所述输出操作数的最高有效位(MSB)的位位置处的第二值位。
9.如权利要求8所述的处理器，其特征在于，所述移位器基于所述输出
操作数的所述MSB的所述位位置，确定移位长度，其中所述移位器通过将所
述输出操作数移位所述移位长度，获得归一化的输出操作数。
10.如权利要求9所述的处理器，其特征在于，所述至少一个浮点单元进
一步包括将由所述移位器获得的所述归一化的输出操作数舍入的舍入器。
11.一种系统，包括：
一个或多个硬件处理器，每一个都包括：
至少一个加法单元，包括：
加法器，所述加法器将第...

【专利技术属性】
技术研发人员：S·卢巴诺维奇，T·庞斯，A·格雷德斯廷，Z·斯波伯，
申请(专利权)人：英特尔公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人