当前位置: 首页 > 专利查询>英特尔公司专利>正文

快速向量动态存储器冲突检测制造技术

技术编号:16401338 阅读:125 留言:0更新日期:2017-10-17 21:33
在一个实施例中,公开了用于在向量化迭代标量操作内执行动态存储器冲突检测的向量冲突检测指令。所述指令可以由向量处理器执行以生成对无冲突迭代组进行标识的分区向量。可以使用所述分区向量来生成用于后续向量操作的写掩码。

Fast vector dynamic memory conflict detection

In one embodiment, a vector conflict detection command for performing dynamic memory conflict detection in a quantized iterative scalar operation is disclosed. The instructions can be executed by a vector processor to generate a partition vector identifying the conflict free iteration group. The partitioning mask can be used to generate write masks for subsequent vector operations.

【技术实现步骤摘要】
【国外来华专利技术】快速向量动态存储器冲突检测专利
本公开涉及处理逻辑、微处理器和相关联的指令集架构领域,所述指令集架构当由处理器或其他处理逻辑执行时执行逻辑操作、数学操作或其他功能操作。相关技术说明许多应用具有大量的数据级并行性,并且应当能够受益于单指令多数据(SIMD)支持。在SIMD执行中,单条指令同时在多个数据元素上进行操作。这通常通过扩展诸如寄存器和算术逻辑单元(ALU)等各种资源的宽度来实现,允许它们分别保持或操作多个数据元素。然而,大多数这样的应用最初被设计为标量进程,即被配置为用于一次处理一个指令和一个数据元素的单指令单数据(SISD)。将标量进程转换为SIMD进程(即,“向量化”)可以提供操作改进,包括缩短的处理时间和增强的资源利用率。然而,重要的是确保由于数据内的冲突和依赖性而在必要时保持标量程序次序。附图说明实施例以举例的方式被展示并且不限于附图中的图,在附图中:图1A是框图,展示了根据实施例的示例性有序获取、解码、引退流水线和示例性寄存器重命名、乱序发布/执行流水线两者;图1B是框图,展示了根据实施例的有序获取、解码、引退核的示例性实施例以有待包含在处理器中的示例性寄存器重命本文档来自技高网...
快速向量动态存储器冲突检测

【技术保护点】
一种处理装置,包括:解码逻辑,所述解码逻辑用于将第一指令解码为经解码的第一指令,所述经解码的指令包括第一操作数和第二操作数;以及执行单元,所述执行单元用于执行所述第一经解码的指令以执行针对向量化迭代标量操作的存储器冲突检测并且导出包括至少一个无冲突的标量迭代组的分区向量;以及寄存器堆单元,所述寄存器堆单元用于将所述分区向量提交到由目的地操作数指定的位置。

【技术特征摘要】
【国外来华专利技术】2014.12.23 US 14/581,9961.一种处理装置,包括:解码逻辑,所述解码逻辑用于将第一指令解码为经解码的第一指令,所述经解码的指令包括第一操作数和第二操作数;以及执行单元,所述执行单元用于执行所述第一经解码的指令以执行针对向量化迭代标量操作的存储器冲突检测并且导出包括至少一个无冲突的标量迭代组的分区向量;以及寄存器堆单元,所述寄存器堆单元用于将所述分区向量提交到由目的地操作数指定的位置。2.如权利要求1所述的处理装置,进一步包括用于获取所述第一指令的指令获取单元,其中,所述指令是单个机器级指令。3.如权利要求1所述的处理装置,其特征在于,所述寄存器堆单元进一步用于存储包括以下各项的一组寄存器:第一寄存器,所述第一寄存器用于存储第一源操作数值;第二寄存器,所述第二寄存器用于存储第二源操作数值;以及第三寄存器,所述第三寄存器用于存储指示无冲突的标量迭代组的至少一个数据元素集合。4.如权利要求3所述的处理装置,其特征在于,所述第一、第二和第三寄存器中的每一个都是向量寄存器。5.如权利要求4所述的处理装置,其特征在于,所述向量寄存器是128位或256位寄存器。6.如权利要求4所述的处理装置,其特征在于,所述向量寄存器是512位寄存器。7.如权利要求4所述的处理装置,其特征在于,所述第一和第二寄存器包括向量化数组,所述向量化数组包括用于所述向量化迭代标量迭代的存储器位置。8.如权利要求7所述的处理装置,其特征在于,所述执行单元进一步用于扫描所述向量化数组以判定第一向量的索引处的元素是否与第二向量中的元素冲突。9.如权利要求8所述的处理装置,其特征在于,当所述第一向量的在第一索引处的元素等于所述第二向量中在第二索引处的元素并且所述第二索引小于所述第一索引时,确定冲突。10.如权利要求9所述的处理装置,其特征在于,所述执行单元进一步用于针对每个确定的冲突写入路径长度。11.如权利要求10所述的处理装置,其特征在于,所述执行单元进一步用于基于元素对之间的最长路径来确定用于所述向量化标量操作的迭代分区。12.如权利要求1-11中任一项所述的处理装置,其特征在于,所述执行单元进一步用于从所述分区向量中导出一组写掩码,以用于执行多个标量迭代作为并行向量操作。13.一种机器可读介质,具有存储在其上的数据,所述数据如果由至少一个机器执行则使所述至少一个机器制造用于执行以下操作的至少一个集成电路,所述操作包括:获取用于执行针对向量化迭代标量操作的存储器冲突检测的单个指令,所述指令具有两个源操作数;将...

【专利技术属性】
技术研发人员:王诚A·哈特诺S·S·巴格索克希吴友峰
申请(专利权)人:英特尔公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1