转换指令制造技术

技术编号：38142681 阅读：19 留言：0更新日期：2023-07-08 09:58

本发明专利技术描述转换指令。描述了用于经由指令进行数据类型转换的技术。示例性指令包括用于以下各项的字段：操作码、源操作对象的标识和目的地操作对象的标识，其中操作码用于指示指令处理电路要进行：将来自所标识的源操作对象的奇数16比特浮点值转换为32比特浮点值，以及将该32比特浮点值存储在所标识的目的地操作对象的数据元素位置中。对象的数据元素位置中。对象的数据元素位置中。

全部详细技术资料下载

【技术实现步骤摘要】
转换指令

技术介绍

[0001]近年来，已经证明具有较低精度的乘法和较高精度的累加的融合乘加(fused
‑
multiply
‑
add，FMA)单元在机器学习/人工智能应用中是有用的，最显著的是在训练深度神经网络时是有用的，这是由于其极高的计算强度。相较于经典的IEEE
‑
754 32比特(FP32)和64比特(FP64)算术，此种精度降低的算术在性质上可以与其缩短的宽度不成比例地加速。
附图说明
[0002]将参考附图来描述根据本公开的各示例，在这些附图中：
[0003]图1图示出不同的浮点表示格式。
[0004]图2(A)图示出用于将来自源的、偶数数据元素位置中存储的BF16值转换为FP32值并将该FP32值存储到目的地的数据元素位置中的单个经解码的指令的示例性执行。
[0005]图2(B)图示出用于将来自源的、偶数数据元素位置中存储的BF16值转换为FP32值并将该FP32值存储到目的地的数据元素位置中的单个经解码的指令的示例性执行。
[0006]图3图示出用于处理VCVTNEEBF162PS指令的方法的示例。
[0007]图4图示出用于VCVTNEEBF162PS指令的指令编码的示例。
[0008]图5图示出用于VCVTNEEBF162PS指令的指令伪代码的示例。
[0009]图6(A)图示出用于将来自源的、奇数数据元素位置中存储的BF16值转换为FP32值并将该FP32值存储到目的地的数据元素位置中的单个经解...

【技术保护点】

【技术特征摘要】
1.一种装置，包括：解码器电路，所述解码器电路用于对单个指令进行解码，所述单个指令包括用于以下各项的字段：操作码、源操作对象的标识和目的地操作对象的标识，其中所述操作码用于指示指令处理电路要进行：将来自所标识的源操作对象的奇数16比特浮点值转换为32比特浮点值，以及将所述32比特浮点值存储在所标识的目的地操作对象的数据元素位置中；以及指令处理电路，所述指令处理电路用于根据所述操作码来执行经解码的指令。2.如权利要求1所述的装置，其中，用于第一源操作对象的标识符的字段用于标识向量寄存器。3.如权利要求1所述的装置，其中，用于第一源操作对象的标识符的字段用于标识存储器位置。4.如权利要求1
‑
3中的任一项所述的装置，其中，所述16比特浮点值是BF16值。5.如权利要求4所述的装置，其中，指令处理电路用于通过将16个零附加到所述BF16值中的每个BF16值来将所述BF16值转换为32比特浮点值。6.如权利要求1
‑
3中的任一项所述的装置，其中，所述16比特浮点值是FP16值。7.一种方法，包括：将第一指令集的单个指令转译为第二指令集的一个或多个指令，所述单个指令包括用于以下各项的字段：操作码、源操作对象的标识和目的地操作对象的标识，其中所述操作码用于指示指令处理电路要进行：将来自所标识的源操作对象的奇数16比特浮点值转换为32比特浮点值，以及将所述32比特浮点值存储在所标识的目的地操作对象的数据元素位置中；对所述第二指令集的一个或多个指令进行解码；以及根据所述第一指令集的所述单个指令的所述操作码，执行所述第二指令集的经解码的一个或多个指令。8.如权利要求7所述的方法，其中，用于第一源操作对象的标识符的字段用于标识向量寄...

【专利技术属性】
技术研发人员：R，
申请(专利权)人：英特尔公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人