具有混合精度运算的处理单元制造技术

技术编号:30426139 阅读:27 留言:0更新日期:2021-10-24 17:00
一种图形处理单元(GPU)[100]实现具有相关联的运算码的运算[105]以执行混合精度数学运算。所述GPU包括具有不同执行路径[106、107]的算术逻辑单元(ALU)[104],其中每个执行路径执行不同的混合精度运算。通过响应于指定描述运算的运算码而实现ALU处的混合精度运算,GPU在减少执行开销的同时高效地提高了指定的数学运算的精度。学运算的精度。学运算的精度。

【技术实现步骤摘要】
【国外来华专利技术】具有混合精度运算的处理单元

技术介绍

[0001]处理器采用一个或多个处理单元,所述一个或多个处理单元被专门设计和配置成代表处理器执行指定的运算。例如,一些处理器采用通常实现多个处理元件(也称为处理器内核或计算单元)的图形处理单元(GPU)和其他并行处理单元,所述处理元件同时在多个数据集上执行单个程序的多个实例,以执行图形、矢量和其他计算处理运算。处理器的中央处理单元(CPU)向GPU提供命令,并且GPU的命令处理器(CP)将命令解码为一个或多个运算。GPU的执行单元,诸如一个或多个算术逻辑单元(ALU),执行运算以执行图形和矢量处理运算。
附图说明
[0002]通过参考附图,可更好地理解本公开,并且本公开的众多特征和优点对本领域技术人员来说变得显而易见。在不同附图中使用的相同附图标记指示相似或相同项。
[0003]图1是根据一些实施方案的采用用于混合精度运算的运算码的处理单元的一部分的框图。
[0004]图2是根据一些实施方案的图1的处理单元的混合精度浮点执行路径的框图。
[0005]图3是根据一些实施方案的图1的处理单元的另一本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种方法,其包括:在处理单元[100]处解码第一指令[101]以识别第一多精度运算[105];以及通过使用不同精度的操作数执行第一数学运算来在算术逻辑单元(ALU)[104]处执行所述第一多精度运算。2.如权利要求1所述的方法,其中所述第一数学运算包括浮点乘法

累加运算。3.如权利要求2所述的方法,其中所述浮点乘法

累加运算将两组N个第一精度的操作数相乘,并将与所述第一精度不同的第二精度的操作数相加。4.如权利要求3所述的方法,其中N至少为二。5.如权利要求4所述的方法,其中N至少为四。6.如权利要求1所述的方法,其中所述第一数学运算包括整数乘法

累加运算。7.如权利要求1所述的方法,其还包括:在所述处理单元处解码第二指令以识别与所述第一多精度运算不同的第二多精度运算;以及通过使用不同精度的操作数执行第二数学运算来在所述ALU处执行所述第二多精度运算,所述第二数学运算与所述第一数学运算不同。8.如权利要求7所述的方法,其中:执行所述第一多精度运算包括在所述ALU的第一执行路径[106]处执行所述第一多精度运算;并且执行所述第二多精度运算包括在所述ALU的第二执行路径[107]处执行所述第二多精度运算,所述第二执行路径与所述第一执行路径不同。9.一种处理单元[100],其包括:解码级[102],用于解码第一指令[101]以识别第一多精度运算[105];以及算术逻辑单元(ALU)[104],用于通过使用不同精度的操作数执行第一数学运算来执行所述第一多精度运算。10.如权利要求9所述的处理单元,其中所述第一数学运算包括浮点乘法

累加运算。11.如权利要求10所述的处理单元,其中所述浮点乘法

累加运算将两组N个第一精度的操作数相乘,并将与所述第一精度...

【专利技术属性】
技术研发人员:何斌迈克尔
申请(专利权)人:超威半导体公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1