当前位置: 首页 > 专利查询>英特尔公司专利>正文

支持8比特浮点格式以用于并行计算和随机舍入操作制造技术

技术编号:44844794 阅读:24 留言:0更新日期:2025-04-01 19:41
公开了一种用来促进图形体系结构中支持8比特浮点格式以用于并行计算和随机舍入操作的设备。所述设备包含处理器,其包括:解码器,其用来将为执行而取得的指令解码成解码的指令,其中解码的指令是要对8比特浮点操作对象进行操作以执行并行点积操作的矩阵指令;调度器,其用来调度解码的指令,并且根据由解码的指令指示的8比特浮点数据格式来提供对于8比特浮点操作对象的输入数据;以及电路模块,其用来执行解码的指令,以使用8比特宽的点积层执行32路点积,每个8比特宽的点积层包括互连的乘法器、移位器以及加法器的一个或多个集合,其中,乘法器、移位器以及加法器的每个集合要生成8比特浮点操作对象的点积。

【技术实现步骤摘要】

本文档一般涉及数据处理,并且更特定地涉及图形体系结构中支持8比特浮点格式以用于并行计算和随机舍入操作


技术介绍

1、当前的并行图形数据处理包含被开发成对图形数据执行特定操作的系统和方法,这些特定操作诸如例如,线性内插、曲面细分、栅格化、纹理映射、深度测试等。传统意义上而言,图形处理器使用固定功能计算单元来处理图形数据;然而,更近来地,已使图形处理器的多个部分可编程,使得此类处理器能够支持更多种多样的操作,以用于处理顶点和片段数据。

2、为了进一步提升性能,图形处理器通常实现诸如管线化的处理技术,这些处理技术尝试贯穿图形管线的不同部分并行地处理尽可能多的图形数据。具有单指令多数据(single instruction multiple data,simd)或单指令多线程(single instructionmultiple thread,simt)体系结构的并行图形处理器被设计成使图形管线中的并行处理的量最大化。在simd体系结构中,带有多个处理元件的计算机尝试对多个数据点同时执行相同操作。在simt体系结构中,并行线程组尝试尽可能经常地一起同本文档来自技高网...

【技术保护点】

1.一种设备,包括:

2.如权利要求1所述的设备,其中,所述移位器要将所述乘法器的输出归一化。

3.如权利要求1-2中任一项所述的设备,其中,所述乘法器包括4比特乘法器、8比特乘法器、16比特乘法器或32比特乘法器中的至少一个乘法器。

4.如权利要求1-3中任一项所述的设备,其中,所述加法器包括要将由所述移位器归一化的所述乘法器生成的积相加的加法器树,并且其中,所述加法器要使用到最接近的偶数的舍入将所述加法器树的结果舍入。

5.如权利要求1-4中任一项所述的设备,其中,所述结果被舍入到由所述解码的指令指示的目的地精度。</p>

6.如权...

【技术特征摘要】

1.一种设备,包括:

2.如权利要求1所述的设备,其中,所述移位器要将所述乘法器的输出归一化。

3.如权利要求1-2中任一项所述的设备,其中,所述乘法器包括4比特乘法器、8比特乘法器、16比特乘法器或32比特乘法器中的至少一个乘法器。

4.如权利要求1-3中任一项所述的设备,其中,所述加法器包括要将由所述移位器归一化的所述乘法器生成的积相加的加法器树,并且其中,所述加法器要使用到最接近的偶数的舍入将所述加法器树的结果舍入。

5.如权利要求1-4中任一项所述的设备,其中,所述结果被舍入到由所述解码的指令指示的目的地精度。

6.如权利要求1-5中任一项所述的设备,其中,所述电路模块还要执行累加器源操作对象的晚期累加,其中,所述累加器源操作对象的所述晚期累加要在所述8比特浮点操作对象的所述点积的所述生成之后被执行。

7.如权利要求1-6中任一项所述的设备,其中,所述电路模块还要执行累加器源操作对象的累加,其中,所述累加器源操作对象的所述累加要在所述电路模块的中间阶段或在所述电路模块的第一阶段之一被执行。

8.如权利要求1-7中任一项所述的设备,其中,所述处理器包括图形处理单元(gpu)。

9.如权利要求1-8中任一项所述的设备,其中,所述设备是单指令多数据(simd)机器或单指令多线程(simt)机器中的至少一个。

10.一种方法,包括:

11.如权利要求10所述的方法,其中,所述移位器要将所述乘法器的输出归一化,其中,所述加法器包括要将由所述移位器归一化的所述乘法器生成的积相加的加法器树,并且其中,所述加法器要使用到最接近的偶数的舍入将所述加法器树的结果舍入。

12.如权利要求10-11中任一项所述的方法,其中,所述结果被舍入到由所述解码的指令指示的目的地精度。

13.如权利要求10-12中任一项所述的方法,还包括:由所述电路模块执行累加器源操作对象的晚期累加,其中,所述累加器源操作对象的所述晚期累加要在所述8比特浮点操作对象的所述点积的生成之后被执行。

14.如权利要求10-13中任一项所述的方法,还包括:由所述电路模块执行累加器源操作对象的累加,其中,所述累加器源操作对象的所述累加要在所述电路模块的中间阶段或在所述电路模块的第一阶段...

【专利技术属性】
技术研发人员:J·E·P·奥索里奥付方文路奎元江宏陈佳升N·K·梅伦普迪K·赫德梅春晖A·哈吉柴布E·泰勒穆帅
申请(专利权)人:英特尔公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1