用于实现具有迭代依赖条件的迭代的向量环路的指令制造技术

技术编号：12783673 阅读：89 留言：0更新日期：2016-01-28 03:36

本申请公开了用于实现具有迭代依赖条件的迭代的向量环路的指令。描述了具有指令执行流水线的处理器。该指令执行流水线包括用于取出指令的指令取出级。该指令标识输入向量操作数，该输入向量操作数的多个输入元素指定两个状态中的一个或另一个。该指令也标识指定基值的第二输入操作数。该指令也标识指定跨度的第三输入操作数。该指令执行流水线也包括用于解码该指令的指令解码器。该指令执行流水线也包括用于执行该指令并提供结果输出向量的功能单元。该功能单元包括逻辑电路，该逻辑电路用于：响应于两个状态中的一个但不是另一个存在于输入向量操作数的对应的元素位置中，通过使从基值导出的值递增跨度以在结果输出向量的特定元素位置中产生元素。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术的领域设及计算科学，更具体地说，本专利技术的领域设及用于消除具有未对齐数据行的数组的处理期间的未对齐的存储器访问的指令集。
技术介绍
图1示出了在半导体忍片上用逻辑电路实现的处理核100的高层级的图。该处理核包括流水线101。该流水线由多个级组成，运些级各自被设计成在完全执行程序代码指令所需的多步骤过程中执行特定步骤。运些级通常至少包括：1)指令取出和解码；2)数据取出；3)执行；4)写回。执行级对由指令标识的并且在先前级（例如，在上述步骤2)中所取出的数据执行由在另一先前级（例如，在上述步骤1)中所取出并解码的相同指令所标识的特定操作。被操作的数据通常是从（通用）寄存器存储空间102中取出的。在该操作完成时所创建的新数据通常也被"写回"到寄存器存储空间（例如，在上述级4)。与执行级相关联的逻辑电路通常由多个"执行单元"或"功能单元"1〇3_1到103_ N构成，运些单元各自被设计成用于执行其自身的唯一操作子集（例如，第一功能单元执行整数数学操作，第二功能单元执行浮点指令，第Ξ功能单元执行来自/去往高速缓存/存储器的加载/存储操作，等等）。由所有运些功能单元执行的所有操作的集合与处理核100所支持的"指令集"相对应。计算机科学领域中广泛认可两种类型的处理器架构："标量"型和"向量"型。标量处理器被设计成用于执行对单个数据集执行操作的指令，而向量处理器被设计成用于执行对多个数据集执行操作的指令。图2A和2B呈现了展示标量处理器与向量处理器之间的基本差异的比较示例。图2A示出标量AND(与）指令的示例，其...

【技术保护点】
一种设备，包括：指令执行流水线，包括：指令取出级，用于取出指令，所述指令标识输入向量操作数，所述输入向量操作数的多个输入元素指定两个状态中的一个或另一个；指令解码器，用于解码所述指令；以及功能单元，用于执行所述指令并提供结果输出向量，所述功能单元包括逻辑电路，所述逻辑电路用于：响应于所述两个状态中的一个但不是另一个存在于所述输入向量操作数的对应的元素位置中，通过使用跨度对从基值导出的值执行操作来产生所述结果输出向量的特定元素位置中的元素。

【技术特征摘要】
...

【专利技术属性】
技术研发人员：M·普罗特尼科夫，
申请(专利权)人：英特尔公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人