用于执行指令以转换成16位浮点格式的系统和方法技术方案

技术编号：24205359 阅读：39 留言：0更新日期：2020-05-20 14:26

本公开涉及用于执行指令以转换成16位浮点格式的系统和方法。在一个实施例中，处理器包括：提取电路，所述提取电路用于提取指令，所述指令具有字段，所述字段用于指定操作码以及包括N个单精度元素的第一源向量和包括至少N个16位浮点元素的目标向量的位置，所述操作码指示执行电路将所述第一源向量的每个元素转换为16位浮点格式，并且将每个经转换的元素存储到所述目标向量的对应位置中，该转换在必要时包括截断和舍入；解码电路，用于对所述指令进行解码；以及执行电路，用于根据所述操作码来对所述指令作出响应。

System and method for executing instructions to convert to 16 bit floating-point format

全部详细技术资料下载

【技术实现步骤摘要】
用于执行指令以转换成16位浮点格式的系统和方法
本专利技术的领域概括而言涉及计算机处理器体系结构，更具体而言涉及用于执行指令以转换成16位浮点格式的系统和方法。
技术介绍
指令集，或者说指令集体系结构(instructionsetarchitecture，ISA)，是与编程有关的计算机体系结构的一部分，并且可包括原生数据类型、指令、寄存器体系结构、寻址模式、存储器体系结构、中断和异常处理以及外部输入和输出(I/O)。指令集包括一个或多个指令格式。给定的指令格式定义各种字段(位的数目、位的位置)来指定要执行的操作和要在其上执行该操作的(一个或多个)操作对象(operand)，等等。给定的指令是使用给定的指令格式来表述的并且指定操作和操作对象。指令流是指令的特定序列，其中序列中的每个指令是某个指令以某种指令格式的出现。科学、金融、自动向量化通用、RMS(识别、挖掘和合成)/视觉和多媒体应用(例如，2D/3D图形、图像处理、视频压缩/解压缩、语音识别算法和音频操纵)经常要求对大量的数据项执行相同的操作(称为“数据并...

【技术保护点】
1.一种处理器，包括：/n提取电路，所述提取电路用于提取指令，所述指令具有字段，所述字段用于指定操作码以及包括N个单精度元素的第一源向量和包括至少N个16位浮点元素的目标向量的位置，所述操作码指示执行电路将所述第一源向量的每个元素转换为16位浮点格式，并且将每个经转换的元素存储到所述目标向量的对应位置中，该转换在必要时包括截断和舍入；/n解码电路，所述解码电路用于对所述指令进行解码；以及/n执行电路，所述执行电路用于根据所述操作码来对所述指令作出响应。/n

【技术特征摘要】
20181109 US 16/186,3841.一种处理器，包括：
提取电路，所述提取电路用于提取指令，所述指令具有字段，所述字段用于指定操作码以及包括N个单精度元素的第一源向量和包括至少N个16位浮点元素的目标向量的位置，所述操作码指示执行电路将所述第一源向量的每个元素转换为16位浮点格式，并且将每个经转换的元素存储到所述目标向量的对应位置中，该转换在必要时包括截断和舍入；
解码电路，所述解码电路用于对所述指令进行解码；以及
执行电路，所述执行电路用于根据所述操作码来对所述指令作出响应。

2.根据权利要求1所述的处理器，其中，所述16位浮点格式包括符号位、8位指数、以及尾数，所述尾数包括7个显式位和第八个隐式位。

3.根据权利要求1所述的处理器，其中，所述16位浮点格式是bfloat16或binary16。

4.根据权利要求1-3中任一项所述的处理器，其中：
所述指令还用于指定包括N个单精度元素的第二源向量的位置；
所述目标向量包括2乘N个16位浮点元素，这些浮点元素的前一半和后一半分别对应于所述第一源向量和所述第二源向量；并且
所述操作码指示执行电路将所述第一源向量和所述第二源向量的每个元素转换成16位浮点格式，并且将每个经转换的元素存储到所述目标向量的对应位置中，该转换在必要时包括截断和舍入。

5.根据权利要求1-3中任一项所述的处理器，其中，所述第一源向量和所述目标向量中的每一个的位置在寄存器中或者在存储器中。

6.根据权利要求1-3中的任一项所述的处理器，其中，N由所述指令指定并且具有4、8、16和32之一的值。

7.根据权利要求1-3中任一项所述的处理器，其中，当所述执行电路执行舍入时，其根据最近偶数舍入规则来执行。

8.根据权利要求1-3中任一项所述的处理器，其中，所述执行电路并行生成所述目标向量的所有N个元素。

9.一种系统，包括处理器和存储器，所述处理器包括：
提取电路，所述提取电路用于提取指令，所述指令具有字段，所述字段用于指定操作码以及包括N个单精度元素的第一源向量和包括至少N个16位浮点元素的目标向量的位置，所述操作码指示执行电路将所述第一源向量的每个元素转换为16位浮点格式，并且将每个经转换的元素存储到所述目标向量的对应位置中，该转换在必要时包括截断和舍入；
解码电路，所述解码电路用于对所述指令进行解码；以及
执行电路，所述执行电路用于根据所述操作码来对所述指令作出响应。

10.根据权利要求9所述的系统，其中，所述16位浮点格式包括符号位、8位指数、以及尾数，所述尾数包括7个显式位和第八个隐式位。

11.根据权利要求9所述的系统，其中，所述16位浮点格式是bfloat16或binary16。

12.根据权利要求9-11中任一项所述的系统...

【专利技术属性】
技术研发人员：亚力山大·F·海涅克，罗伯特·瓦伦泰恩，马克·J·查尼，拉阿南·萨德，梅纳赫姆·阿德尔曼，泽夫·斯帕波，阿米特·格拉德斯坦，西蒙·鲁巴诺维奇，
申请(专利权)人：英特尔公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人