当前位置: 首页 > 专利查询>英特尔公司专利>正文

BFLOAT16比较指令制造技术

技术编号:36739205 阅读:29 留言:0更新日期:2023-03-04 10:13
本申请公开了BFLOAT16比较指令。描述了用于比较BF16数据元素的技术。示例性BF16指令包括用于以下各项的字段:操作码、第一紧缩数据源操作对象的位置的标识、以及第二紧缩数据源操作对象的位置的标识,其中,操作码用于指示出执行电路要进行:针对紧缩数据源操作对象的特定数据元素位置执行该位置处的数据元素的比较,以及基于该比较来更新标志寄存器。以及基于该比较来更新标志寄存器。以及基于该比较来更新标志寄存器。

【技术实现步骤摘要】
BFLOAT16比较指令

技术介绍

[0001]近年来,已经证明具有较低精度的乘法和较高精度的累加的融合乘加(fused

multiply

add,FMA)单元在机器学习/人工智能应用中是有用的,最显著的是在训练深度神经网络时是有用的,这是由于其极高的计算强度。相较于经典的IEEE

754 32比特(FP32)和64比特(FP64)算术,此种精度降低的算术在性质上可以与其缩短的宽度不成比例地加速。
附图说明
[0002]将参考附图来描述根据本公开的各实施例,其中:
[0003]图1图示不同的浮点表示格式。
[0004]图2图示用于确定两个源的对应数据元素位置的BF16数据元素之间的最大值的指令的示例性执行。
[0005]图3图示由处理器执行的、用于处理指令以确定两个源的对应数据元素位置的BF16数据元素之间的最大值的方法的实施例。
[0006]图4图示用于确定两个源的对应数据元素位置的BF16数据元素之间的最大值的指令的执行的更详细的实施例。<br/>[0007]本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种设备,包括:解码装置,用于对单个指令的实例进行解码,所述单个指令包括用于以下各项的字段:操作码、第一紧缩数据源操作对象的位置的标识、以及第二紧缩数据源操作对象的位置的标识,其中,所述操作码用于指示出执行装置要进行:针对紧缩数据源操作对象的特定数据元素位置执行该位置处的BF16数据元素的比较,以及基于所述比较来更新标志寄存器;以及所述执行装置,用于根据所述操作码执行经解码的指令。2.如权利要求1所述的设备,其中,用于所述第一源操作对象的标识的字段用于标识向量寄存器。3.如权利要求1所述的设备,其中,用于所述第一源操作对象的标识的字段用于标识存储器位置。4.如权利要求1

3中任一项所述的设备,其中,当所述比较指示未排序结果时,所述标志寄存器的零标志、奇偶性标志和进位标志被设置为1。5.如权利要求1

3中任一项所述的设备,其中,当所述比较指示所述第一源的数据元素大于所述第二源的数据元素时,所述标志寄存器的零标志、奇偶性标志和进位标志被设置为0。6.如权利要求1

3中任一项所述的设备,其中,当所述比较指示所述第一源的数据元素小于所述第二源的数据元素时,所述标志寄存器的零标志被设置为0,所述标志寄存器的奇偶性标志被设置为0,并且所述标志寄存器的进位标志被设置为1。7.如权利要求1

3中任一项所述的设备,其中,当所述比较指示所述第一源的数据元素等于所述第二源的数据元素时,所述标志寄存器的进位标志被设置为0,所述标志寄存器的奇偶性标志被设置为0,并且所述标志寄存器的零标志被设置为1。8.一种系统,包括:存储器,用于存储单个指令的实例;解码装置,用于对所述单个指令的所述实例进行解码,所述单个指令包括用于以下各项的字段:操作码、第一紧缩数据源操作对象的位置的标识、以及第二紧缩数据源操作对象的位置的标识,其中,所述操作码用于指示出执行装置要进行:针对紧缩数据源操作对象的特定数据元素位置执行该位置处的BF16数据元素的比较,以及基于所述比较来更新标志寄存器;以及所述执行装置,用于根据所述操作码执行经解码的指令。9.如权利要求8所述的系统,其中,用于所述第一源操作对象的标识的字段用于标识向量寄存器。10.如权利要求8所述的系统,其中,用于所述第一源操作对象的标识的字段用于标识存储器位置。11.如权利要求8

10中任一项所述的系统,其中,当所述比较指示未排序结果时,所述标志寄存器的零标志、奇偶性标志和进位标志被设置为1。12.如权利要求8

10中任一项所述的系统,其中,当所述比较指示所述...

【专利技术属性】
技术研发人员:A
申请(专利权)人:英特尔公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1