The present disclosure relates to a method and device for performing a multi precision calculation in a plurality of arithmetic logic units (ALU), which includes making a first single instruction / multiple data (SIMD) block channel device paired with a second SIMD block channel device to produce a first block with a single layer staggered between the first and second channel devices. A third SIMD block channel device is paired with a fourth SIMD block channel device to produce a single level interlaced second pair between the third and fourth channel devices. A plurality of source inputs are received at the first pair and the second block pairs. The first block calculates the first result and the second block pair calculates the second result.
【技术实现步骤摘要】
用于执行低功率和低延时多精度计算的方法和系统
技术介绍
单指令/多数据(SIMD)块内的常规向量着色器处理器包含具有算术逻辑单元(ALU)的四个管线通道(例如,X、Y、Z和W通道),它们在每一循环中彼此交错从而总共得到三个额外层级。考虑相应管线级内以及相应管线级之间的5到8个循环的内部ALU延时,由于SIMD块中的支持操作/计算的每一额外管线级,因此会存在明显的硅占据面积和功耗开销。也就是说,每一ALU包含相邻通道的ALU之间的单循环差异。使用三级通道交错架构(即,通道时移)允许实现常见的向量点积运算,但是引入了额外的管线分级寄存器。此架构也可通过在相邻SIMD通道中使用32位ALU而用于64位浮点运算实现。由于三层级通道交错架构的使用引入了三个额外管线级,所以这导致单向量着色器处理器内的寄存器硬件和延时开销。因此,由于大多数寄存器触发器含有数据且经常双态触发,因此所述三个管线级消耗了有用的功率。三层级交错通道架构的实施例可以参见美国专利No.8,468,191,所述美国专利如同完整陈述那样以引用方式并入本文。附图说明从以下通过结合附图给出的描述可得到更详细的理解,附图 ...
【技术保护点】
一种用于在多个算术逻辑单元(ALU)中执行多精度计算的方法,其包括:使第一单指令/多数据(SIMD)块通道装置与第二SIMD块通道装置配对以产生在所述第一与第二通道装置之间具有单层级交错的第一块对;使第三SIMD块通道装置与第四SIMD块通道装置配对以产生在所述第三与第四通道装置之间具有单层级交错的第二块对;在所述第一块对和所述第二块对处接收多个源输入;由所述第一块对计算第一结果;以及由所述第二块对计算第二结果。
【技术特征摘要】
1.一种用于在多个算术逻辑单元(ALU)中执行多精度计算的方法,其包括:使第一单指令/多数据(SIMD)块通道装置与第二SIMD块通道装置配对以产生在所述第一与第二通道装置之间具有单层级交错的第一块对;使第三SIMD块通道装置与第四SIMD块通道装置配对以产生在所述第三与第四通道装置之间具有单层级交错的第二块对;在所述第一块对和所述第二块对处接收多个源输入;由所述第一块对计算第一结果;以及由所述第二块对计算第二结果。2.如权利要求1所述的方法,其进一步包括在SIMD块通道装置未用于计算的周期期间对所述SIMD块通道装置中的一者或多者进行时钟门控。3.如权利要求1所述的方法,其进一步包括在所述第一SIMD块通道装置的输出寄存器处输出所述第一结果。4.如权利要求1所述的方法,其进一步包括在所述第二SIMD块通道装置的输出寄存器处输出所述第一结果。5.如权利要求1所述的方法,其进一步包括在所述第三SIMD块通道装置的输出寄存器处输出所述第二结果。6.如权利要求1所述的方法,其进一步包括在所述第四SIMD块通道装置的输出寄存器处输出所述第二结果。7.如权利要求1所述的方法,其中所述第一结果和所述第二结果是相同结果。8.如权利要求1所述的方法,其进一步包括对所述结果执行归一化。9.如权利要求1所述的方法,其中所述第一结果是在超越运算的第一遍次中产生并且由所述第一块对利用以计算用于输出的第三结果。10.如权利要求9所述的方法,其中所述第二结果是在超越运算的所述第一遍次中产生并且由所述第二块对利用以计算用于输出的第四结果。11.一种用于执行多精度计算的设备,其包括:第一算术逻辑单元(ALU);第二ALU,其以操作方式与所述第一ALU连接,其中所述第一ALU与具有单层级交错的第二ALU配对,作为被配置成用于接收多个输入且计算第一结果的第一计算单元;第三ALU;以及第四ALU,其以操作方式与所述第三...
【专利技术属性】
技术研发人员:何斌,邹云霄,陈家盛,迈克尔·曼托,
申请(专利权)人:超威半导体公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。