One aspect of the processor includes a plurality of compact data registers and decoding units for decoding instructions. This instruction is used to indicate the compact data registers used to store the address information of the source compact memory in multiple compact data registers. Source compact memory address information includes multiple memory address information data elements. The execution unit is coupled with the decoding unit and a plurality of compact data registers, which are used in response to instructions for loading multiple data elements from multiple memory addresses corresponding to different memory address information data elements in each of the memory address information data elements, and storing multiple data elements to be loaded in the destination storage location. The destination storage location does not include registers in multiple compact data registers.
【技术实现步骤摘要】
【国外来华专利技术】用于将多个数据元素加载到除紧缩数据寄存器之外的目的地存储位置的处理器、方法、系统和指令政府权益的声明本专利技术是在由国防部授予的合同号H98230-13-D-0124的政府支持下进行的。政府具有本专利技术的某些权益。
本文中所描述的实施例总体上涉及处理器。具体而言,本文中所描述的实施例总体上涉及处理器的存储器访问能力。
技术介绍
处理器常执行用于访问存储器的指令。例如,处理器可执行加载指令以从存储器读取或加载数据,和/或可执行存储指令以向存储器写入或存储数据。对于至少一些应用和用途,快速地从存储器加载数据的能力可显著地影响性能。例如,这对于各种不同类型的存储器访问密集型应用通常可以是事实。附图说明通过参考以下描述以及用于说明实施例的附图,可最佳地理解本专利技术。在附图中:图1是可操作用于执行索引加载指令的实施例的处理器的实施例的框图,该索引加载指令具有不在紧缩数据寄存器的集合中的目的地存储位置。图2是执行索引加载指令的实施例的方法的实施例的流程框图,该索引加载指令具有不是紧缩数据寄存器的目的地存储位置。图3是可操作用于执行索引加载指令的实施例的处理器的实施例的框图,该索引加载指令具有绕过高速缓存的非时效性加载操作。图4是用于执行索引加载指令的合适的执行单元的示例实施例的框图。图5是合适的区块化转换后备缓冲器(TLB)的示例实施例的框图。图6是合适的并发加载操作分派单元的示例实施例的框图。图7A是示例存储队列以及合适的扩展存储队列的示例实施例的框图。图7B示出可按其提交图7A的示例的操作的顺序。图8是图示合适的存储器排序语义的示例实施例的示例指令序列的流程框 ...
【技术保护点】
1.一种处理器,包括:多个紧缩数据寄存器;解码单元,用于对指令解码,所述指令用于指示多个紧缩数据寄存器中用于存储源紧缩存储器地址信息的紧缩数据寄存器,所述源紧缩存储器地址信息包括多个存储器地址信息数据元素;以及执行单元,与所述解码单元和所述多个紧缩数据寄存器耦合,所述执行单元响应于所述指令而用于:从各自都与所述多个存储器地址信息数据元素中的不同存储器地址信息数据元素对应的多个存储器地址加载多个数据元素;以及将被加载的所述多个数据元素存储在目的地存储位置中,其中,所述目的地存储位置不包括所述多个紧缩数据寄存器中的寄存器。
【技术特征摘要】
【国外来华专利技术】2016.09.30 US 15/283,2591.一种处理器,包括:多个紧缩数据寄存器;解码单元,用于对指令解码,所述指令用于指示多个紧缩数据寄存器中用于存储源紧缩存储器地址信息的紧缩数据寄存器,所述源紧缩存储器地址信息包括多个存储器地址信息数据元素;以及执行单元,与所述解码单元和所述多个紧缩数据寄存器耦合,所述执行单元响应于所述指令而用于:从各自都与所述多个存储器地址信息数据元素中的不同存储器地址信息数据元素对应的多个存储器地址加载多个数据元素;以及将被加载的所述多个数据元素存储在目的地存储位置中,其中,所述目的地存储位置不包括所述多个紧缩数据寄存器中的寄存器。2.如权利要求1所述的处理器,进一步包括高速缓存,并且其中,所述执行单元响应于所述指令而用于非时效性地加载所述多个数据元素,非时效性地加载所述多个数据元素包括:不将被加载的所述数据元素存储在与从中加载所述多个数据元素的多个存储器地址对应的任何高速缓存行中。3.如权利要求1所述的处理器,其中,所述解码单元用于对用于指示与所述目的地存储位置对应的目的地存储器地址信息的指令进行解码。4.如权利要求1所述的处理器,进一步包括高速缓存,并且其中,所述执行单元响应于所述指令而用于将被加载的所述多个数据元素存储在作为所述高速缓存中的高速缓存行的目的地存储位置中。5.如权利要求4所述的处理器,进一步包括第一级(L1)高速缓存,其中,所述解码单元用于对用于隐式地指示所述高速缓存的指令进行解码,并且其中,所述高速缓存不是所述L1高速缓存。6.如权利要求4所述的处理器,其中,所述解码单元用于对具有用于显式地指定所述高速缓存的字段的指令进行解码。7.如权利要求4所述的处理器,其中,所述执行单元响应于所述指令而用于将所述高速缓存行配置为是不能读取且不能驱逐的,直到所述多个数据元素已被加载。8.如权利要求1所述的处理器,其中,所述执行单元响应于所述指令而用于将被加载的所述多个数据元素存储在作为存储器中的存储器位置的目的地存储位置中。9.如权利要求1至8中的任一项所述的处理器,其中,所述执行单元响应于所述指令而用于从存储器加载所述多个数据元素中的每个数据元素作为单独的数据元素而不加载任何附加的相邻数据元素。10.如权利要求1至8中的任一项所述的处理器,进一步包括并发加载操作分派单元,所述并发加载操作分派单元用于并发地为所述多个数据元素中的至少两个数据元素分派至少两个加载操作。11.如权利要求10所述的处理器,其中,所述处理器包括多个核,其中,所述并发加载操作分派单元与所述多个核中的第一核对应,并且所述处理器进一步包括用于所述多个核中的每个核的不同的并发加载操作分派单元。12.如权利要求1至8中的任一项所述的处理器,进一步包括区块化的转换后备缓冲器(TLB),所述区块化的TLB具有多个TLB区块,所述多个TLB区块用于并发地将多个逻辑地址转换为多个物理地址。13.如权利要求12所述的处理器,其中,所述多个TLB中的每个TLB用于被映射到逻辑地址的不同集合。14.如权利要求1至8中的任一项所述的处理器,进一步包括:存储队列,用于对操作排队;以及扩展存储队列,用于对包括不与所述指令对应的操作的多个操作排队,并且其中,用于在所述扩展存储队列中被排队的多个操作用于相对于用于在所述存储队列中被排队的多个操作按序被提交。15.如权利要求14所述的处理器,其中,所述存储队列用于支持存储至加载转发,并且其中,...
【专利技术属性】
技术研发人员:W·C·哈森普劳伽,C·J·纽本,小西蒙·C·史迪力,S·S·苏里,
申请(专利权)人:英特尔公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。