A processor includes a core for executing instructions and a logic for determining the step data that the instruction will need to convert from the source data in the memory. The stride data includes a corresponding index element that is loaded from the structure of the source data and will be loaded into the same register that will be used to execute the instructions. The core also includes logic for loading source data into the initial vector register. When residing in the vector register, the source data is not aligned. The core includes the logic for the following operations: applying a mixed instruction to the contents of the preliminary vector register so that the corresponding index elements from the plurality of structures are loaded into the corresponding temporary vector register; and another mixing instruction is applied to the content of the temporary vector register so that the attached structure is attached. The loading element is loaded into the corresponding source vector register.
【技术实现步骤摘要】
【国外来华专利技术】用于混合和置换操作序列的指令和逻辑
本公开涉及处理逻辑、微处理器和相关联的指令集架构领域,所述指令集架构当由处理器或其他处理逻辑执行时执行逻辑、数学或其他功能操作。相关技术说明多处理器系统正变得越来越普遍。多处理器系统的应用包括动态域分区一直延续到桌面计算。为了利用多处理器系统,可以将有待执行的代码分成多个线程以供由各种处理实体执行。可以彼此并行地执行每个线程。当指令在处理器上接收时其可以被解码为原生或更原生的词语或指令字以供在处理器上执行。处理器可以在片上系统中实施。被组织成三到五个元素的元组的数据结构可以用于媒体应用、高性能计算应用、以及分子动力学应用中。附图说明实施例以举例的方式被展示并且不限于附图中的图:图1A是根据本公开的实施例的形成有可以包括用于执行指令的执行单元的处理器的示例性计算机系统的框图;图1B展示了根据本公开的实施例的数据处理系统;图1C展示了用于执行文本串比较操作的数据处理系统的其他实施例;图2是根据本公开的实施例的可以包括用于执行指令的逻辑电路的处理器的微架构的框图;图3A展示了根据本公开的实施例的多媒体寄存器中的各种紧缩数据类型表示;图3B展示了根据本公开的实施例的可能的寄存器中数据存储格式(in-registerdatastorageformat);图3C展示了根据本公开的实施例的多媒体寄存器中的各种有符号和无符号紧缩数据类型表示;图3D展示了操作编码格式的实施例;图3E展示了根据本公开的实施例的具有四十个位或更多个位的另一种可能的操作编码格式;图3F展示了根据本公开的实施例的又另一种可能的操作编码格式;图4A是框图,展示 ...
【技术保护点】
1.一种处理器,包括:前端,用于接收指令;解码器,用于对所述指令进行解码;核,用于执行所述指令,所述核包括:第一逻辑,用于确定所述指令将需要从存储器中的源数据转换而来的跨步数据,所述跨步数据包括来自所述源数据中的多个结构的、将加载到将用于执行所述指令的同一寄存器中的相应有索引元素;第二逻辑,用于将源数据加载到多个初步向量寄存器中,当驻留在所述向量寄存器中时,所述源数据是未对齐的;第三逻辑,用于对所述初步向量寄存器的内容应用混合指令以使来自所述多个结构的相应有索引元素加载到对应临时向量寄存器中;以及第四逻辑,用于对所述临时向量寄存器的内容应用另外的混合指令以使来自所述多个结构的另外的相应有索引元素加载到对应源向量寄存器中;以及引退单元,用于引退所述指令。
【技术特征摘要】
【国外来华专利技术】2015.12.18 US 14/974,7291.一种处理器,包括:前端,用于接收指令;解码器,用于对所述指令进行解码;核,用于执行所述指令,所述核包括:第一逻辑,用于确定所述指令将需要从存储器中的源数据转换而来的跨步数据,所述跨步数据包括来自所述源数据中的多个结构的、将加载到将用于执行所述指令的同一寄存器中的相应有索引元素;第二逻辑,用于将源数据加载到多个初步向量寄存器中,当驻留在所述向量寄存器中时,所述源数据是未对齐的;第三逻辑,用于对所述初步向量寄存器的内容应用混合指令以使来自所述多个结构的相应有索引元素加载到对应临时向量寄存器中;以及第四逻辑,用于对所述临时向量寄存器的内容应用另外的混合指令以使来自所述多个结构的另外的相应有索引元素加载到对应源向量寄存器中;以及引退单元,用于引退所述指令。2.如权利要求1所述的处理器,其特征在于,所述核进一步包括第五逻辑,所述第五逻辑用于在完成源数据到跨步数据的转换时对一个或多个源向量寄存器执行所述指令。3.如权利要求1所述的处理器,其特征在于,所述核进一步包括第五逻辑,所述第五逻辑用于对每个对应源向量寄存器执行置换操作以将内容重新安排成与所述源数据中的原始相对顺序相匹配。4.如权利要求1所述的处理器,其特征在于:在所述第四逻辑的执行之后,每个源向量寄存器都包括所述源数据的缺少元素;并且所述核进一步包括第五逻辑,所述第五逻辑用于从所述源数据对每个源向量寄存器执行加载以提供所述缺少元素。5.如权利要求1所述的处理器,其特征在于:所述跨步数据包括八个向量寄存器,每个向量都包括与其他向量相对应的五个元素;并且将对所述初步向量寄存器和所述临时向量寄存器的内容应用十一个混合操作以产生所述对应源向量寄存器的内容。6.如权利要求1所述的处理器,其特征在于:所述跨步数据包括八个向量寄存器,每个向量都包括与其他向量相对应的五个元素;并且将对所述初步向量寄存器和所述临时向量寄存器的内容应用十五个混合操作以产生所述对应源向量寄存器的内容。7.如权利要求1所述的处理器,其特征在于:所述跨步数据包括八个向量寄存器,每个向量都包括与其他向量相对应的五个元素;将对所述初步向量寄存器和所述临时向量寄存器的内容应用十五个混合操作以产生所述对应源向量寄存器的内容;并且将在应用所述十五个混合操作时使用三个掩码以产生所述源向量寄存器的内容。8.一种系统,包括:前端,用于接收指令;解码器,用于对所述指令进行解码;核,用于执行所述指令,所述核包括:第一逻辑,用于确定所述指令将需要从存储器中的源数据转换而来的跨步数据,所述跨步数据包括来自所述源数据中的多个结构的、将加载到将用于执行所述指令的同一寄存器中的相应有索引元素;第二逻辑,用于将源数据加载到多个初步向量寄存器中,当驻留在所述向量寄存器中时,所述源数据是未对齐的;第三逻辑,用于对所述初步向量寄存器的内容应用混合指令以使来自所述多个结构的相应有索引元素加载到对应临时向量寄存器中;以及第四逻辑,用于对所述临时向量寄存器的内容应用另外的混合指令以使来自所述多个结构的另外的相应有索引元素加载到对应源向量寄存器中;以及引退单元,用于引退所述指令。9.如权利要求8所述的系统,其特征在于,所述核进一步包括第五逻...
【专利技术属性】
技术研发人员:E·乌尔德阿迈德瓦尔,S·赛尔,J·哈,
申请(专利权)人:英特尔公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。