用于实现高效同步和并行归约操作的向量指令制造技术

技术编号：10286725 阅读：183 留言：0更新日期：2014-08-06 11:56

本发明专利技术公开了用于实现高效同步和并行归约操作的向量指令。在一个实施例中，处理器可包括：向量单元，用于响应于单条指令对多个数据元素执行操作；以及耦合到向量单元的控制单元，用于向该向量单元提供数据元素，其中该控制单元使得能响应于要在第一掩码下执行的第一向量指令和要在第二掩码下执行的第二向量指令对这些数据元素中的至少一些数据元素执行原子向量操作。描述并要求保护其他实施例。

全部详细技术资料下载

【技术实现步骤摘要】
用于实现高效同步和并行归约操作的向量指令本专利技术专利申请是国际申请号为PCT/US2009/038596，国际申请日为2009年3月27日，进入中国国家阶段的申请号为200980110598.7，名称为“用于实现高效同步和并行归约操作的向量指令”的专利技术专利申请的分案申请。背景许多应用有大量数据级并行性且应当能够获益于单指令多数据(SIMD)支持。在SIMD执行中，单条指令同时对多个数据元素进行操作。这典型地通过扩展诸如寄存器和算术逻辑单元(ALU)等各种资源的宽度来实现，从而允许它们分别保持多个数据元素或对多个数据元素进行操作。然而，许多此类应用花费大量时间对一组稀疏位置进行原子操作，因此从SIMD得到的益处有限，因为当前架构不支持原子向量操作。在许多应用中，常常在多处理器系统中执行同步原语和并行归约(reduction)操作。同步原语确保了在多个线程协同工作时程序按正确次序执行。这些原语常常使用原子读-修改-写操作来实现。归约是许多科学应用中存在的常见操作。当多个线程并行地执行归约时，通常使用原子读-修改-写序列来确保竞态条件下的正确性。现代并行架构装备有SIMD单元以改善具有数据级并行性的许多应用的性能。为了维持SIMD效率，此类架构不仅允许SIMD算术运算而且还允许SIMD存储器(通过聚集-分散单元)读写。然而，这些架构都不支持SIMD原子操作。结果是这些原子操作不能被向量化，因此必须使用标量代码来实现。这可能使SIMD效率显著降级，尤其是在SIMD宽度(即，同时处理的元素的数目)较大时(例如，16)。分散归约是许多应用中常见的操作。例如，可以使...
用于实现高效同步和并行归约操作的向量指令

【技术保护点】
一种处理器，包括：第一逻辑单元，用于处理加载和存储指令；以及第二逻辑单元，用于处理聚集和分散指令，所述第二逻辑单元用于接收第一向量指令、各自至具有包括多个数据元素的向量的相应数据元素的存储位置的多个地址、以及与所述向量相关联的掩码信息，并且用于加载从与所述多个地址中由所述掩码信息指示的每个地址相对应的存储位置获得的数据元素，以及用于预留所述存储位置。

【技术特征摘要】
2008.03.28 US 12/079,7741.一种处理器，包括：第一逻辑单元，用于处理加载和存储指令；以及第二逻辑单元，用于处理聚集和分散指令，所述第二逻辑单元用于接收第一向量指令、各自至具有包括多个数据元素的向量的相应数据元素的存储位置的多个地址、以及与所述向量相关联的掩码信息，并且用于加载从与所述多个地址中由所述掩码信息指示的每个地址相对应的存储位置获得的数据元素，以及用于预留所述存储位置。2.如权利要求1所述的处理器，其特征在于，所述第二逻辑单元用于用与所述数据元素中未成功获得的每个数据元素相对应的无效指示符来更新所述掩码信息。3.如权利要求2所述的处理器，其特征在于，所述第二逻辑单元用于加载和预留与成功获得的数据元素相对应的多个数据元素的子集。4.如权利要求1所述的处理器，其特征在于，所述第二逻辑单元用于接收第二向量指令、各自至具有所述向量的相应数据元素的存储位置的第二多个地址、以及第二掩码信息，并且若与所述第二多个地址中由所述第二掩码信息指示的每个地址相对应的存储位置仍被预留，则将来自源存储的数据元素写入与所述第二多个地址中由所述第二掩码信息指示的每个地址相对应的存储位置。5.如权利要求4所述的处理器，其特征在于，所述第二逻辑单元用于用与所述存储位置中不再被预留的每个存储位置相对应的无效指示符从所述第二掩码信息生成输出掩码。6.如权利要求1所述的处理器，其特征在于，所述预留的存储位置将由以后的指令使用。7.如权利要求1所述的处理器，其特征在于，所述第二逻辑单元包括：控制逻辑单元；掩码存储单元，用于存储所述掩码信息；以及向量存储单元，用于存储被加载的数据元素。8.如权利要求7所述的处理器，其特征在于，所述第二逻辑单元包括混洗逻辑单元，所述混洗逻辑单元用于混洗所述向量存储单元中存储的数据元素。9.如权利要求8所述的处理器，其特征在于，所述第二逻辑单元进一步用于接收所述向量存储单元中的用于存储所述数据元素的目的地。10.一种用于实现同步和并行归约操作的处理器，包括：单指令多数据(SIMD)单元，用于响应于单条指令对多个数据元素执行操作；以及掩码存储单元，用于存储一个或多个掩码；以及耦合到所述单指令多数据(SIMD)单元的控制单元，用于向所述单指令多数据(SI...

【专利技术属性】
技术研发人员：M·斯密尔安斯基，S·库玛，D·金，V·W·李，A·D·恩古耶，YK·陈，C·休格斯，C·金，J·查乌加尼，
申请(专利权)人：英特尔公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人