在不同的粒度水平下对数据值进行广播和掩码的指令执行制造技术

技术编号：22594355 阅读：16 留言：0更新日期：2019-11-20 10:55

一种装置，包括用于执行第一指令和第二指令的执行单元。该执行单元包括输入寄存器空间，该输入寄存器空间用于存储在执行第一指令时要复制的第一数据结构，且用于存储在执行第二指令时要复制的第二数据结构。第一和第二数据结构均是打包数据结构。第一打包数据结构的数据值是第二打包数据结构的数据值的两倍大。该执行单元还包括复制逻辑电路，用于在执行第一指令时复制第一数据结构以创建第一复制数据结构，并用于在执行第二数据指令时复制第二数据结构以创建第二复制数据结构。该执行单元还包括掩码逻辑电路，用于在第一粒度下对第一复制数据结构进行掩码操作，并在第二粒度下对第二复制数据结构进行掩码操作。第二粒度是第一粒度的一半。

Instruction execution to broadcast and mask data values at different granularity levels

An apparatus includes an execution unit for executing a first instruction and a second instruction. The execution unit includes an input register space for storing the first data structure to be copied when the first instruction is executed, and for storing the second data structure to be copied when the second instruction is executed. The first and second data structures are both packed data structures. The data value of the first package data structure is twice as large as that of the second package data structure. The execution unit also includes a copy logic circuit for copying a first data structure to create a first copy data structure when the first instruction is executed, and for copying a second data structure to create a second copy data structure when the second data instruction is executed. The execution unit also includes a mask logic circuit for masking the first replication data structure at the first granularity and the second replication data structure at the second granularity. The second granularity is half of the first.

全部详细技术资料下载

【技术实现步骤摘要】
在不同的粒度水平下对数据值进行广播和掩码的指令执行本申请是针对2017年4月19日提的申请号为201710258062.6、题为“用于指令处理的装置、用于处理指令的方法和机器可读介质”的分案申请再次提出的分案申请。分案申请201710258062.6是PCT国际申请号为PCT/US2011/067095、国际申请日为2011年12月23日、进入中国国家阶段的申请号为201180076281.3，题为“在不同的粒度水平下对数据值进行广播和掩码的指令执行”的专利技术专利申请的分案申请。
本专利技术一般属于计算科学，更具体地涉及在不同的粒度水平下对数据值进行广播和掩码的指令执行。
技术介绍
图1示出了在半导体芯片上用逻辑电路实现的处理核100的高级图。该处理核包括流水线101。该流水线由各自被设计成在完全执行程序代码指令所需的多步骤过程中执行特定步骤的多个级组成。这些级通常至少包括：1)指令取出和解码；2)数据取出；3)执行；4)写回。执行级对由在先前级(例如在上述步骤1))中所取出和解码的指令所标识并在另一先前级(例如在上述步骤2))中被取出的数据执行由在先前级(例如在上述步骤1))中取出和解码的指令所标识的特定操作。被操作的数据通常是从(通用)寄存器存储空间102中取出的。在该操作完成时所创建的新数据通常也被“写回”寄存器存储空间(例如在上述级4))。与执行级相关联的逻辑电路通常由多个“执行单元”或“功能单元”103_1至103_N构成，这些单元各自被设计成执行其自身的唯一操作子集(例如，第一功能单元执...

【技术保护点】
1.一种装置，包括：/n执行单元，用于执行第一指令和第二指令，所述执行单元包括以下部件：/ni)输入寄存器空间，用于存储在执行所述第一指令时要复制的第一数据结构，并用于存储在执行所述第二指令时要复制的第二数据结构，所述第一和第二数据结构均为打包数据结构，所述第一打包数据结构的数据值是所述第二打包数据结构的数据值的两倍大；/nii)复制逻辑电路，用于在执行所述第一指令时复制所述第一数据结构以创建第一复制数据结构，并用于在执行所述第二指令时复制所述第二数据结构以创建第二复制数据结构；/niii)掩码逻辑电路，用于在第一粒度下对所述第一复制数据结构进行掩码操作，并在第二粒度下对所述第二复制数据结构进行掩码操作，所述第二粒度是所述第一粒度的一半。/n

【技术特征摘要】
1.一种装置，包括：
执行单元，用于执行第一指令和第二指令，所述执行单元包括以下部件：
i)输入寄存器空间，用于存储在执行所述第一指令时要复制的第一数据结构，并用于存储在执行所述第二指令时要复制的第二数据结构，所述第一和第二数据结构均为打包数据结构，所述第一打包数据结构的数据值是所述第二打包数据结构的数据值的两倍大；
ii)复制逻辑电路，用于在执行所述第一指令时复制所述第一数据结构以创建第一复制数据结构，并用于在执行所述第二指令时复制所述第二数据结构以创建第二复制数据结构；
iii)掩码逻辑电路，用于在第一粒度下对所述第一复制数据结构进行掩码操作，并在第二粒度下对所述第二复制数据结构进行掩码操作，所述第二粒度是所述第一粒度的一半。

2.如权利要求1所述的装置，其特征在于，所述第一复制数据结构包括所述第一数据结构的四个副本。

3.如权利要求1所述的装置，其特征在于，所述第一复制数据结构包括所述第一数据结构的两个副本。

4.如权利要求1所述的装置，其特征在于，所述第二复制数据结构包括所述第二数据结构的八个副本。

5.一种方法，包括：
取出用于第一指令的第一数据结构，所述第一数据结构是第一打包数据结构；
通过以下方式来执行所述第一指令：在执行单元内复制所述第一数据结构以创建第一复制数据结构，并对所述第一复制数据结构进行掩码操作；
取出用于第二指令的第二数据结构，所述第二数据结构是第二打包数据结构，所述第一打包数据结构的数据值是所述第二打包数据结构的数据值的两倍大；
通过以下方式来执行所述第二指令：在所述执行单元内复制所述第二数据结构以创建第二复制数据结构，并在对所述第一复制数据结构的所述掩码操作的一半粒度下对所述第二复制数据结构进行掩码操作。

...

【专利技术属性】
技术研发人员：E·乌尔德阿迈德瓦尔，R·凡伦天，J·考博尔，B·L·托尔，M·J·查尼，
申请(专利权)人：英特尔公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人