使用写掩码将两个源操作数混合进单个目的地的处理器制造技术

技术编号：15391270 阅读：35 留言：0更新日期：2017-05-19 04:40

公开了使用写掩码将两个源操作数混合进单个目的地的系统、装置和方法。在一些实施例中，混合指令的执行导致使用写掩码的相对应位位置作为第一和第二操作数之间的选择器来进行对第一和第二源操作数的数据元素的逐数据元素的选择，及将所选择的数据元素在目的地的相对应位置处存储进目的地。

System, device, and method for mixing two source operands into a single destination using a write mask

Systems, devices, and methods for mixing two source operands into a single destination using a write mask are disclosed. In some embodiments, the mixed execution resulting in the corresponding position as between the first and the second operand selector by data elements on the data elements of the first and second source operand of the selected write mask, and select the data elements in the destination corresponding to the position of storage enter the destination.

全部详细技术资料下载

【技术实现步骤摘要】
使用写掩码将两个源操作数混合进单个目的地的系统、装置和方法本申请是国际申请日为2011年12月12日、中国国家阶段申请号为201180069936.4、题为“使用写掩码将两个源操作数混合进单个目的地的系统、装置和方法”的专利技术专利申请的分案申请。
本专利技术的领域一般涉及计算机处理器架构，以及更具体地涉及当被执行时导致特定结果的指令。
技术介绍
基于控制流信息合并来自向量源的数据是基于向量的架构的普遍问题。例如，为了将以下代码向量化，需要：1)生成指示a[i]>0是否为真的布尔向量的方法和2)基于该布尔向量从两个源(A[i]或B[i])中选择任一值并将内容写入不同目的地(C[i])的方法。附图说明作为示例而非限制，在附图中示出了本专利技术，附图中相似的附图标记指示相似的元素，附图中：图1示出了混合指令执行的示例。图2示出了混合指令执行的另一个示例。图3示出了混合指令的伪代码的示例。图4示出了在处理器中使用混合指令的实施例。图5示出了用于处理混合指令的方法的实施例。图6示出了用于处理混合指令的方法的实施例。图7A是示出根据本专利技术实施例的通用向量友好指令格式和其A类指令模板的框图。图7B是示出根据本专利技术实施例的通用向量友好指令格式和其B类指令模板的框图。图8A-C示出了根据本专利技术实施例的示例性特定向量友好指令格式。图9是根据本专利技术一实施例的寄存器架构的框图。图10A是根据本专利技术实施例的单个CPU核以及它与管芯上互连网络的连接和它的2级(L2)高速缓存本地子集的框图。图10B是根据本专利技术实施例的图10A中的CPU核的一部分的分解图...
<a href="http://www.xjishu.com/zhuanli/55/201611035320.html" title="使用写掩码将两个源操作数混合进单个目的地的处理器原文来自X技术">使用写掩码将两个源操作数混合进单个目的地的处理器</a>

【技术保护点】
在计算机处理器中执行混合指令的方法，所述方法包括：提取所述混合指令，其中所述混合指令包括写掩码操作数、目的地操作数、第一源操作数和第二源操作数；解码所提取的混合指令；执行所解码的混合指令以使用所述写掩码的相对应位位置作为所述第一和第二操作数之间的选择器来执行对第一和第二源操作数的数据元素的逐数据元素选择；以及将所选择的数据元素在所述目的地的相对应位置处存储到目的地。

【技术特征摘要】
2011.04.01 US 13/078,8641.在计算机处理器中执行混合指令的方法，所述方法包括：提取所述混合指令，其中所述混合指令包括写掩码操作数、目的地操作数、第一源操作数和第二源操作数；解码所提取的混合指令；执行所解码的混合指令以使用所述写掩码的相对应位位置作为所述第一和第二操作数之间的选择器来执行对第一和第二源操作数的数据元素的逐数据元素选择；以及将所选择的数据元素在所述目的地的相对应位置处存储到目的地。2.如权利要求1所述的方法，其特征在于，所述写掩码是16-位寄存器。3.如权利要求1所述的方法，其特征在于，所述写掩码是16-位寄存器且仅八个最低有效位位置被用作选择器且所述数据元素的大小是64位。4.如权利要求1所述的方法，其特征在于，所述第一源是512-位寄存器且所述第二源是存储器。5.如权利要求4所述的方法，其特征在于，所述第二源的数据元素是从16-位上转换到32-位的。6.如权利要求1所述的方法，其特征在于，所述第一和第二源是512-位寄存器。7.如权利要求1所述的方法，其特征在于，其中所述判断对所述写掩码的每个位位置并行进行。8.如权利要求1所述的方法，其特征在于，其中所述第一和第二源操作数是512-位寄存器。9.如权利要求1所述的方法，其特征在于，其中所述第二源操作数是512-位存储器位置且来自该存储器位置的数据元素在所述源的串接之前被加载进临时512-位寄存器。10.如权利要求1所述的方法，其特征在于，所述数据元素是32-位的。11.一种方法，所述方法包括：响应于包括第一和第二源操作数、目的地操作数、写掩码操作数的混合指令，评估所述写掩码在第一位位置处的值，判断所述第一位位置处的值是否指示所述第一源的相对应第一数据元素应被保存在所述目的地的相对应第一数据元素位置或是否所述第二源的相对应第一数据元素应被保存在所述目的地的相对应第一数据元素位置，且将由所述第一位位置处的值所指示的所述第一数据元素存储进所述...

【专利技术属性】
技术研发人员：J·C·三额詹，B·L·托尔，R·C·凡伦天，J·G·韦德梅耶，S·萨姆德若拉，M·B·吉尔卡尔，A·T·福塞斯，E·乌尔德阿迈德瓦尔，D·R·布拉德福德，L·K·吴，
申请(专利权)人：英特尔公司，
类型：发明
国别省市：美国,US

全部详细技术资料下载我是这个专利的主人