矢量打包有符号值的相乘、求反和累加的系统、设备和方法技术方案

技术编号：20840947 阅读：73 留言：0更新日期：2019-04-13 08:34

描述了用于处理器中的数据值的乘法、求反和累加的系统、设备和方法的实施例。例如，执行电路执行解码的指令以将来自第一和第二打包数据源操作数中的多个打包数据元素位置的选择的数据值相乘，以生成多个第一结果值，对多个第一结果值求和，以生成一个或多个第二结果值，对一个或多个第二结果值求反，以生成一个或多个第三结果值，累加一个或多个第三结果值与来自目的地操作数的一个或多个数据值，以生成一个或多个第四结果值，以及在目的地操作数中的一个或多个打包数据元素位置中存储一个或多个第三结果值。

全部详细技术资料下载

【技术实现步骤摘要】
矢量打包有符号值的相乘、求反和累加的系统、设备和方法
本专利技术的实施例涉及计算机处理器架构的领域。更特定地，实施例涉及在被执行时，造成矢量打包有符号数据值的相乘、求反和累加的指令。
技术介绍
指令集或指令集架构（ISA）是与编程有关的计算机架构的一部分，包括原生数据类型、指令、寄存器架结构、寻址模式、存储器架构、中断和异常处理、以及外部输入和输出（I/O）。在这里，术语“指令”通常指的是宏指令，也就是，被提供到处理器以用于执行的指令，其不同于微指令或微操作，也就是，处理器的解码器解码宏指令的结果。微指令或微操作能够配置成指示处理器上的执行单元执行操作以实现与宏指令关联的逻辑。ISA不同于微架构，微架构是用于实现指令集的处理器设计技术的集合。带有不同微架构的处理器能够共享共用指令集。例如，Intel®Pentium4处理器、Intel®CoreTM处理器、和来自加利福尼亚州桑尼威尔（Sunnyvale）的超微半导体有限公司（AdvancedMicroDevices,Inc.）的处理器实现几乎相同版本的x86指令集（带有已经随着较新版本被加入的一些扩展），但具有不同内部设计。例如，ISA的相同寄存器架构可使用公知的技术在不同微架构中以不同方式来实现，包括专用物理寄存器、使用寄存器重命名机制（例如，使用寄存器别名表（RAT）、重新排序缓冲器（ROB）和引退寄存器堆）的一个或多个动态分配的物理寄存器。除非另有说明，否则词语寄存器架构、寄存器堆和寄存器在本文中用于指的是对软件/程序员可见的东西以及指令指定寄存器所用的方式。在要求区分的情况下，形容词“逻辑的”、“架...

【技术保护点】
1.一种用于执行指令的方法，所述方法包括：由解码电路解码指令，所述指令具有用于第一和第二打包数据源操作数、和打包数据目的地操作数的字段；通过以下操作由执行电路执行解码的指令：将来自所述第一和第二打包数据源操作数中的多个打包数据元素位置的选择的数据值相乘，以生成多个第一结果值；对所述多个第一结果值求和，以生成一个或多个第二结果值；对所述一个或多个第二结果值求反，以生成一个或多个第三结果值；累加所述一个或多个第三结果值，以生成一个或多个第四结果值；以及在所述目的地操作数中的一个或多个打包数据元素位置中存储所述一个或多个第四结果值。

【技术特征摘要】
2017.09.29 US 15/7215991.一种用于执行指令的方法，所述方法包括：由解码电路解码指令，所述指令具有用于第一和第二打包数据源操作数、和打包数据目的地操作数的字段；通过以下操作由执行电路执行解码的指令：将来自所述第一和第二打包数据源操作数中的多个打包数据元素位置的选择的数据值相乘，以生成多个第一结果值；对所述多个第一结果值求和，以生成一个或多个第二结果值；对所述一个或多个第二结果值求反，以生成一个或多个第三结果值；累加所述一个或多个第三结果值，以生成一个或多个第四结果值；以及在所述目的地操作数中的一个或多个打包数据元素位置中存储所述一个或多个第四结果值。2.如权利要求1所述的方法，其中由所述解码电路执行所述解码的指令进一步包括将来自所述第一和第二打包数据源操作数中的所述多个打包数据元素位置的数据值复用到至少一个乘法器电路。3.如权利要求2所述的方法，其中基于在所述第一和第二打包数据源操作数中共享相同打包数据元素位置的数据值，将来自所述第一和第二打包数据源操作数中的所述多个打包数据元素位置的所述数据值复用到所述至少一个乘法器电路。4.如权利要求1所述的方法，其中所述一个或多个第二结果值由一个或多个加法器网络生成。5.如权利要求1所述的方法，其中存储所述一个或多个第三结果值包括在所述打包数据目的地操作数的上半部分中存储结果值和在所述打包数据目的地操作数的下半部分中存储结果值。6.如权利要求1所述的方法，其中所述将所述选择的数据值相乘包括：执行运算S1H*S2H、S1G*S2G、S1F*S2F和S1E*S2E以及运算S1D*S2D、S1C*S2C、S1B*S2B和S1A*S2A，以生成所述多个第一结果值，其中S1标识所述第一打包数据源操作数，S2标识所述第二打包数据源操作数，并且A、B、C、D、E、F、G和H标识在所述第一和第二打包数据源操作数中从最低到最高数据元素位置排序的所述打包数据元素位置。7.如权利要求6所述的方法，其中对所述多个第一结果值求和包括执行运算（S1H*S2H）+（S1G*S2G）+（S1F*S2F）+（S1E*S2E）和执行运算（S1H*S2H）+（S1G*S2G）+（S1B*S2B）+（S1A*S2A），以生成所述一个或多个第二结果值。8.如权利要求1所述的方法，进一步包括，响应于检测到所述一个或多个第三结果值的某个值高于阈值，在所述目的地操作数的对应位置中存储最大值...

【专利技术属性】
技术研发人员：VR马杜里，E奥德艾哈迈德瓦尔，R瓦伦丁，J科巴尔，M查尼，
申请(专利权)人：英特尔公司，
类型：发明
国别省市：美国,US

全部详细技术资料下载我是这个专利的主人