用于在处理具有未对齐数据行的数组期间消除未对齐的存储器访问的指令集制造技术

技术编号：12782128 阅读：79 留言：0更新日期：2016-01-28 01:17

本申请公开了用于在处理具有未对齐数据行的数组期间消除未对齐的存储器访问的指令集。描述了具有指令执行流水线的处理器。该指令执行流水线包括用于取出指令的指令取出级。该指令的指令格式指定第一输入向量、第二输入向量和第三输入操作数。该指令执行流水线包括用于解码该指令的指令解码级。该指令执行流水线包括用于执行该指令的功能单元。该功能单元包括路由网络，该路由网络将来自多个输入向量中的一个的第一端的第一连续的元素组路由至该指令的结果向量的第二端，并且将来自多个输入向量中的另一个的第二端的第二连续的元素组路由至该指令的结果向量的第一端。第一端和第二端是相反的向量端。从第三输入操作数来定义第一连续的元素组和第二连续的元素组。该指令不能够将来自多个输入向量的非连续的元素组路由至该指令的结果向量。还描述了使用该指令的软件流水线。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术的领域设及计算科学，更具体地说，本专利技术的领域设及用于消除具有未对齐数据行的数组的处理期间的未对齐的存储器存取的指令集。
技术介绍
图1示出了在半导体忍片上用逻辑电路实现的处理核100的高层级的图。该处理核包括流水线101。该流水线由多个级组成，运些级各自被设计成在完全执行程序代码指令所需的多步骤过程中执行特定步骤。运些级通常至少包括：1)指令取出和解码；2)数据取出；3)执行；4)写回。执行级对由指令标识的并且在先前级（例如，在上述步骤2)中所取出的数据执行由在另一先前级（例如，在上述步骤1)中所取出并解码的相同指令所标识的特定操作。被操作的数据通常是从（通用）寄存器存储空间102中取出的。在该操作完成时所创建的新数据通常也被"写回"到寄存器存储空间（例如，在上述级4)。与执行级相关联的逻辑电路通常由多个"执行单元"或"功能单元"103_1到103_ N构成，运些单元各自被设计成用于执行其自身的唯一操作子集（例如，第一功能单元执行整数数学操作，第二功能单元执行浮点指令，第Ξ功能单元执行来自/去往高速缓存/存储器的加载/存储操作，等等）。由所有运些功能单元执行的所有操作的集合与处理核100所支持的"指令集"相对应。计算机科学领域中广泛认可两种类型的处理器架构："标量"型和"向量"型。标量处理器被设计成用于执行对单个数据集执行操作的指令，而向量处理器被设计成用于执行对多个数据集执行操作的指令。图2A和2B呈现了展示标量处理器与向量处理器之间的基本差异的比较示例。图2A示出标量AND(与）指令的示例，其中...

【技术保护点】
一种处理器，包括：指令执行流水线，包括：指令取出级，用于取出指令，所述指令的指令格式指定第一输入向量、第二输入向量和第三输入操作数；指令解码级，用于解码所述指令；以及功能单元，用于执行所述指令，所述功能单元包括路由网络，所述路由网络用于将来自所述多个输入向量中的一个的第一端的第一连续的元素组路由至所述指令的结果向量的第二端，并且将来自所述多个输入向量中的另一个的第二端的第二连续的元素组路由至所述指令的结果向量的第一端，所述第一端和所述第二端是相反的向量端，其中，从所述第三输入操作数来定义所述第一连续的元素组和所述第二连续的元素组，所述指令不能够将来自所述多个输入向量的非连续的元素组路由至所述指令的结果向量。

【技术特征摘要】
...

【专利技术属性】
技术研发人员：M·普罗特尼科夫，I·厄莫拉夫，
申请(专利权)人：英特尔公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人