用于对齐寄存器的系统、装置和方法制造方法及图纸

技术编号：16427537 阅读：50 留言：0更新日期：2017-10-21 21:54

说明了用于在计算机处理器中执行对齐指令的系统、装置和方法的实施例。在一些实施例中，对齐指令的执行使得两个串接源的数据元素的选择性存储存储在目的地中。

System, device and method for aligning registers

Embodiments of systems, devices, and methods for performing alignment instructions in a computer processor are described. In some embodiments, the execution of the alignment command makes the selective storage of the data elements of the two serially connected sources stored in the destination.

全部详细技术资料下载

【技术实现步骤摘要】
用于对齐寄存器的系统、装置和方法本申请是2012年03月29日提交的申请号为201280026790.X的同名专利申请的分案申请。
本专利技术的领域一般涉及计算机处理器体系结构，尤其涉及当被执行时引起特定结果的指令。
技术介绍
随着处理器的单指令多数据(SIMD)宽度增加，应用程序开发者(和编译器)越来越难以充分使用SIMD硬件，因为数据元素不会自然地与全矢量的大小对齐并且通常产生高速缓冲存储行分裂，其中存储器参考位于高速缓冲存储器层级的两个不同行上。常规地，处理高速缓冲存储行分裂涉及到：检测高速缓冲存储行分裂状态，进行两次不同的TLB查找，进行两次高速缓冲存储行存取，以及因此使用两个独立的存储器端口，和/或使用专用逻辑在来自存储器途中合并来自两个连续高速缓冲存储行的数据片。附图说明在附图中通过举例的方式而不是限制的方式阐述了本专利技术，其中相似的附图标记表示相似的元件，并且其中：图1描绘了ALIGN(对齐)指令的示例性执行。图2描绘了ALIGN指令的示例性执行。图3描绘了ALIGN指令的示例性执行。图4示出了通过在处理器中执行对齐指令而对齐来自两个源的数据以及将该对齐存储到目的地位置的方法的实施例。图5示出了用于处理对齐指令的方法的实施例。图6示出了用于处理对齐指令的方法的实施例。图7示出了用于处理伪码的对齐指令的方法的实施例。图8A是示出根据本专利技术的实施例的一般矢量友好指令格式及其A类指令模板的框图。图8B是示出根据本专利技术的实施例的一般矢量友好指令格式及其B类指令模板的框图。图9A-C示出了根据本专利技术的实施例的示例性的特定矢量友好指令格式。...
用于对齐寄存器的系统、装置和方法

【技术保护点】
一种在计算机处理器中执行对齐指令的方法，包括：取出所述对齐指令，其中所述对齐指令包括写屏蔽操作数、目的地操作数、第一源操作数、第二源操作数和偏移值；对所取出的对齐指令进行解码；通过如下操作来执行经解码的对齐指令将所述第一源操作数的第一多个数据元素和所述第二源操作数的第二多个数据元素串接，基于所述偏移值将串接的数据元素向右移位，以及基于写屏蔽的相应位来确定向右移位的、串接的数据元素的哪些将被存储在目的地的相应位置上；以及将所述向右移位的、串接的数据元素的已被确定为应当存储到所述目的地的那些数据元素存储在所述目的地中的所述相应位置上。

【技术特征摘要】
2011.04.01 US 13/078,8681.一种在计算机处理器中执行对齐指令的方法，包括：取出所述对齐指令，其中所述对齐指令包括写屏蔽操作数、目的地操作数、第一源操作数、第二源操作数和偏移值；对所取出的对齐指令进行解码；通过如下操作来执行经解码的对齐指令将所述第一源操作数的第一多个数据元素和所述第二源操作数的第二多个数据元素串接，基于所述偏移值将串接的数据元素向右移位，以及基于写屏蔽的相应位来确定向右移位的、串接的数据元素的哪些将被存储在目的地的相应位置上；以及将所述向右移位的、串接的数据元素的已被确定为应当存储到所述目的地的那些数据元素存储在所述目的地中的所述相应位置上。2.如权利要求1所述的方法，其中所述写屏蔽是16位寄存器。3.如权利要求1所述的方法，其中所述偏移是8位立即数值。4.如权利要求1所述的方法，还包括：确定是否使用所述写屏蔽；以及如果不使用所述写屏蔽，则将所述向右移位的、串接的数据元素中的数据元素存储在所述目的地的所述相应位置上，而不基于所述写屏蔽的相应位来确定所述向右移位的、串接的数据元素中的哪些将被存储在所述目的地的相应位置上。5.如权利要求1所述的方法，其中针对所述写屏蔽的每个位位置并行地进行所述确定。6.如权利要求1所述的方法，其中所述第一源操作数和第二源操作数是512位寄存器。7.如权利要求1所述的方法，其中所述第二源操作数是512位存储器单元，并且来自所述存储器单元的数据元素在所述源的串接之前被加载到临时的512位寄存器中。8.如权利要求1所述的方法，其中所述第一操作数的数据元素是所述向右移位的、串接的数据元素中的最低有效数据元素。9.一种方法，包括：响应对齐指令，所述对齐指令包括第一和第二源操作数、目的地操作数、写屏蔽操作数和偏移，将第一源的第一数据元素集合与第二源的第二数据元素集合串接；将串接的数据元素向右移位X数据元素，其中X是在所述对齐指令中提供的立即数值；以及对于写屏蔽的第一位位置，确定所述第一位位置是否指示经移位的、串接的数据元素的相应数据元素将被存储在目的地的相应位置上，当所述写屏蔽的所述第一位位置指示所述经移位的、串接的数据元素的所述相应数据元素应当被存储时，将所述经移位的、串接的数据元素的所述相应数据元素存储在所述目的地中的相应位置上，并且当...

【专利技术属性】
技术研发人员：J·C·圣阿德里安，R·E·桑斯，M·B·吉尔卡尔，L·K·吴，D·R·布拉德福德，V·W·李，
申请(专利权)人：英特尔公司，
类型：发明
国别省市：美国,US

全部详细技术资料下载我是这个专利的主人