用于在加载数据元素以供执行时考虑空间局部性的装置和方法制造方法及图纸

技术编号：16112634 阅读：37 留言：0更新日期：2017-08-30 05:59

在本发明专利技术的一个实施例中，处理器包括上级高速缓存和至少一个处理器核。至少一个处理器核包括一个或多个寄存器以及多个指令处理级：解码单元，用于解码指令，指令需要多个数据元素的输入，其中多个数据元素中的每一个的大小小于处理器的高速缓存行的大小；执行单元，用于将多个数据元素加载到处理器的一个或多个寄存器，而不将空间上邻近所述多个数据元素的数据元素或所述多个数据元素加载到上级高速缓存中。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于在加载数据元素以供执行时考虑空间局部性的装置和方法
本公开涉及微处理器，并且更具体地涉及在微处理器中加载数据元素以供执行。背景数组的跨度(也被称为增量、间距或步长)指示数组的连续数组元素开始的两个存储器位置之间的距离。许多科学应用具有拥有大跨度的数组。这些数组在例如以下情形时自然地发生：·访问矩阵(或2D/3D数组)。如果顺序地访问相同列的元素，例如A[0][3]、A[l][3]、A[2][3]...·访问被组织为结构数组(AoS)的相同数量的结构，例如A[0]-权重、A[l]-权重、A[2]-权重...由于所使用的算法的本质，此类有跨度的访问模式在高性能计算(HPC)和科学计算应用中是常见的。这些有跨度的访问中的许多具有大跨度值，通常大于高速缓存行的长度(例如，64字节)。此类访问不具有空间局部性。即，如果数据元素X被访问，则接近数据元素X的数据元素与远离数据元素X的数据元素相比被访问的可能更低。附图说明在附图的图形中作为示例而非限制地说明了本专利技术，在附图中，类似的参考编号表示类似的元件。图1示出根据本专利技术的一个实施例的处理器的系统架构。图2示出根据本专利技术的实施例对在加载数据元素时考虑和不考虑局部性的情形下的操作的比较。图3A-B是示出根据本专利技术的一个实施例的在处理器中加载用于执行的数据元素时考虑局部性的方法的流程图。图4A是示出根据本专利技术的一个实施例的用于加载在连续数据元素之间不具有固定距离的多个数据元素并且不考虑空间局部性的指令类型的一个实现方式的伪代码。图4B是示出根据本专利技术的一个实施例的用于加载在连续数据元素之间具...
用于在加载数据元素以供执行时考虑空间局部性的装置和方法

【技术保护点】
一种加载数据元素的处理器，包括：上级高速缓存；以及至少一个处理器核，耦合到所述上级高速缓存，包括一个或多个寄存器以及多个指令处理级：解码器单元，用于解码指令，所述指令需要多个数据元素的输入，其中所述多个数据元素中的每一个的大小小于所述处理器的高速缓存行的大小，以及执行单元，用于将所述多个数据元素加载到所述一个或多个寄存器，而不将空间上邻近所述多个数据元素的数据元素或所述多个数据元素加载到所述上级高速缓存中。

【技术特征摘要】
【国外来华专利技术】2014.12.11 US 14/567,6021.一种加载数据元素的处理器，包括：上级高速缓存；以及至少一个处理器核，耦合到所述上级高速缓存，包括一个或多个寄存器以及多个指令处理级：解码器单元，用于解码指令，所述指令需要多个数据元素的输入，其中所述多个数据元素中的每一个的大小小于所述处理器的高速缓存行的大小，以及执行单元，用于将所述多个数据元素加载到所述一个或多个寄存器，而不将空间上邻近所述多个数据元素的数据元素或所述多个数据元素加载到所述上级高速缓存中。2.如权利要求1所述的处理器，其特征在于，对所述多个数据元素的加载用于：将所述多个数据元素聚集到临时缓冲器中；以及将所述多个数据元素从所述临时缓冲器加载到所述一个或多个寄存器。3.如权利要求1所述的处理器，其特征在于，对所述多个数据元素的加载用于：将所述多个数据元素聚集到所述处理器的低级高速缓存中；以及将所述多个数据元素从所述低级高速缓存加载到所述一个或多个寄存器。4.如权利要求1所述的处理器，其特征在于，所述指令具体用于在不考虑空间局部性的情形下对数据元素的执行。5.如权利要求4所述的处理器，其特征在于，所述指令指定所述多个数据元素的数据元素之间的跨度值。6.如权利要求5所述的处理器，其特征在于，所述跨度值大于所述处理器的高速缓存行的大小。7.如权利要求4所述的处理器，其特征在于，所述指令指定对应于所述多个数据元素中的每一个的位置的索引。8.一种用于在处理器中加载数据元素的方法，包括：解码指令，其中所述指令需要多个数据元素的输入，其中所述多个数据元素中的每一个的大小小于所述处理器的高速缓存行的大小；在解码所述指令之后，将所述多个数据元素加载到所述处理器的一个或多个寄存器以供执行，而不将空间上邻近所述多个数据元素的数据元素或所述多个数据元素加载到所述处理器的上级高速缓存中。9.如权利要求8所述的方法，其特征在于，将所述多个数据元素加载到所述一个或多个寄存器包括：将所述多个数据元素聚集到临时缓冲器中；以及将所述多个数据元素从所述临时缓冲器加载到所述一个...

【专利技术属性】
技术研发人员：R·萨桑卡，E·乌尔德阿迈德瓦尔，
申请(专利权)人：英特尔公司，
类型：发明
国别省市：美国,US

全部详细技术资料下载我是这个专利的主人