当前位置: 首页 > 专利查询>英特尔公司专利>正文

用于从多个股分派指令的处理器逻辑和方法技术

技术编号:13893872 阅读:65 留言:0更新日期:2016-10-24 19:06
一种处理器包括用于执行下述操作的逻辑:获取指令流,所述指令流被划分为用于在一个或多个执行端口上加载的多个股;识别多个未决指令;确定哪些股有效;确定每个未决指令的程序次序;以及基于每个未决指令的程序次序以及每个股是否有效将未决指令与执行端口进行匹配。每个未决指令位于一个股的各自的头。

【技术实现步骤摘要】
【国外来华专利技术】
本公开涉及处理逻辑、微处理器和关联的指令集架构的领域,当由处理器或其它处理逻辑执行所述关联的指令集架构时,所述关联的指令集架构执行逻辑、数学或其它功能操作。
技术介绍
多处理器系统正在变得越来越普遍。多处理器系统的应用包括动态域分割直至桌上型计算。为了利用多处理器系统,待执行的代码可被分成用于由各种处理实体执行的多个线程。每个线程可被彼此并行地执行。另外,为了增加处理实体的效用,可采用无序执行。当使这种指令的需要输入可用时,无序执行可执行指令。因此,可在较早出现在代码序列中的指令之前执行较晚出现在代码序列中的指令。附图说明在附图的图中作为例子而非限制示出实施例:图1A是根据本公开的实施例的用处理器形成的示例性计算机系统的方框图,所述处理器可包括用于执行指令的执行单元;图1B图示根据本公开的实施例的数据处理系统;图1C图示用于执行文本串比较操作的数据处理系统的其它实施例;图2是根据本公开的实施例的针对处理器的微架构的方框图,所述处理器可包括用于执行指令的逻辑电路;图3A图示根据本公开的实施例的多媒体寄存器中的各种压缩数据类型表示;图3B图示根据本公开的实施例的可能的寄存器内数据存储格式;图3C图示根据本公开的实施例的多媒体寄存器中的各种有符号和无符号压缩数据类型表示;图3D图示操作编码格式的实施例;图3E图示根据本公开的实施例的具有四十或更多位的另一可能的操作编码格式;图3F图示根据本公开的实施例的又一可能的操作编码格式;图4A是图示根据本公开的实施例的按顺序流水线和寄存器重新命名级、无序发出/执行流水线的方框图;图4B是图示根据本公开的实施例的将要被包括在处理器中的按顺序架构核和寄存器重新命名逻辑、无序发出/执行逻辑的方框图;图5A是根据本公开的实施例的处理器的方框图;图5B是根据本公开的实施例的核的示例性实现方式的方框图;图6是根据本公开的实施例的系统的方框图;图7是根据本公开的实施例的第二系统的方框图;图8是根据本公开的实施例的第三系统的方框图;图9是根据本公开的实施例的片上系统的方框图;图10图示根据本公开的实施例的可执行至少一个指令的包含中央处理单元和图形处理单元的处理器;图11是图示根据本公开的实施例的IP核的开发的方框图;图12图示根据本公开的实施例的第一类型的指令可如何由不同类型的处理器仿真;图13图示根据本公开的实施例的将使用软件指令转换器将源指令集中的二进制指令转换成目标指令集中的二进制指令做对比的方框图;图14是根据本公开的实施例的处理器的指令集架构的方框图;图15是根据本公开的实施例的处理器的指令集架构的更详细的方框图;图16是根据本公开的实施例的针对处理器的执行流水线的方框图;图17是根据本公开的实施例的用于利用处理器的电子装置的方框图;图18图示根据本公开的实施例的用于分派指令的示例性系统;图19是根据本公开的实施例的指令调度单元的示例性实施例的图示;图20是根据本公开的实施例的指令调度单元的另一图示;图21是根据本公开的实施例的逻辑矩阵的示例性实施例和逻辑矩阵模块的示例性操作的图示;图22图示根据本公开的实施例的修改的逻辑矩阵和矩阵操纵器的示例性操作;图23图示根据本公开的实施例的另一修改的逻辑矩阵和另一矩阵操纵器的示例性操作;图24图示根据本公开的实施例的又一矩阵操纵器的示例性操作;和图25图示根据本公开的实施例的用于分派指令的方法的示例性实施例。具体实施方式下面的描述描述用于在处理器、虚拟处理器、封装、计算机系统或其它处理设备内或者结合处理器、虚拟处理器、封装、计算机系统或其它处理设备分派指令的指令和处理逻辑。这种处理设备可包括无序处理器。另外,这种处理设备可包括多股无序处理器。在下面的描述中,阐述许多特定细节(诸如,处理逻辑、处理器类型、微架构条件、事件、使能机构等)以便提供对本公开的实施例的更彻底的理解。然而,本领域技术人员将会领会,可在没有这种特定细节的情况下实践实施例。另外,一些公知结构、电路等未被详细地示出以避免不必要地使本公开的实施例模糊。虽然参照处理器描述下面的实施例,但其它实施例适用于其它类型的集成电路和逻辑装置。本公开的实施例的类似技术和教导可被应用于可受益于更高的流水线吞吐量和提高的性能的其它类型的电路或半导体装置。本公开的实施例的教导适用于执行数据操纵的任何处理器或机器。然而,实施例不限于执行512位、256位、128位、64位、32位或16位数据运算的处理器或机器,并且可被应用于可执行数据的操纵或管理的任何处理器和机器。另外,下面的描述提供例子,并且附图为了说明的目的而示出各种例子。然而,这些例子不应该在限制性意义上被解释,因为它们仅意图提供本公开的实施例的例子,而非提供本公开的实施例的所有可能的实现方式的穷举列表。虽然以下的例子描述在执行单元和逻辑电路的上下文中的指令处理和分发,但可通过存储在机器可读、有形介质上的数据或指令来完成本公开的其它实施例,当由机器执行所述数据或指令时,所述数据或指令使机器执行与本公开的至少一个实施例一致的功能。在一个实施例中,与本公开的实施例关联的功能被体现于机器可执行指令。所述指令可被用于使可被利用所述指令编程的通用或专用处理器执行本公开的步骤。本公开的实施例可被提供作为计算机程序产品或软件,所述计算机程序产品或软件可包括已存储有指令的机器或计算机可读介质,所述指令可被用于对计算机(或其它电子装置)进行编程以执行根据本公开的实施例的一个或多个操作。另外,本公开的实施例的步骤可由包含用于执行所述步骤的固定功能逻辑的特定硬件部件或由已编程计算机部件和固定功能硬件部件的任何组合执行。用于对逻辑进行编程以执行本公开的实施例的指令可被存储在系统中的存储器(诸如,DRAM、高速缓存、闪存或其它存储器)内。另外,可经网络或通过其它计算机可读介质分发指令。因此,机器可读介质可包括用于存储或传送具有可由机器(例如,计算机)读取的形式的信息的任何机构,但不限于软盘、光盘、压缩盘、只读存储器(CD-ROM)和磁光盘、只读存储器(ROM)、随机存取存储器(RAM)、可擦除可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)、磁卡或光学卡、闪存或者在经电、光学、听觉或其它形式的传播信号(例如,载波、红外信号、数字信号等)通过互联网的信息的传输中使用的有形、机器可读存储器。因此,计算机可读介质可包括适合存储或传送具有可由机器(例如,计算机)读取的形式的电子指令或信息的任何类型的有形机器可读介质。设计可经过从创建到仿真到加工的各种阶段。代表设计的数据可按照许多方式代表设计。首先,可使用硬件描述语言或另一功能描述语言表示硬件,这可在模拟中有用。另外,可在设计过程的一些阶段生产具有逻辑和/或晶体管门的电路级模型。另外,在某个阶段,设计可达到代表硬件模型中的各种装置的物理放置的数据的水平。在其中使用一些半导体加工技术的情况下,代表硬件模型的数据可以是指定用于生产集成电路的掩模的不同掩模层上的各种特征的存在或不存在的数据。在设计的任何表示中,数据可被存储在任何形式的机器可读介质中。存储器或者磁存储器或光学存储器(诸如,盘)可以是用于存储经为了传送这种信息而调制或以其它方式生成的光波或电波传送的信息的机器可读本文档来自技高网...

【技术保护点】
一种处理器,包括:第一逻辑,用于获取指令流,所述指令流被划分为将要在一个或多个执行端口上加载的多个股;第二逻辑,用于识别多个未决指令,每个未决指令位于一个股的各自的头;第三逻辑,用于确定哪些股有效;第四逻辑,用于确定每个未决指令的程序次序;和第五逻辑,用于基于每个未决指令的程序次序以及每个股是否有效将未决指令与执行端口进行匹配。

【技术特征摘要】
【国外来华专利技术】1. 一种处理器,包括:第一逻辑,用于获取指令流,所述指令流被划分为将要在一个或多个执行端口上加载的多个股;第二逻辑,用于识别多个未决指令,每个未决指令位于一个股的各自的头;第三逻辑,用于确定哪些股有效;第四逻辑,用于确定每个未决指令的程序次序;和第五逻辑,用于基于每个未决指令的程序次序以及每个股是否有效将未决指令与执行端口进行匹配。2. 如权利要求1所述的处理器,还包括:第六逻辑,用于确定一个未决指令与一个执行端口的端口绑定;和第七逻辑,用于基于每个未决指令的程序次序、每个股是否有效以及端口绑定将未决指令与执行端口进行匹配。3. 如权利要求1所述的处理器,其中用于将未决指令与执行端口进行匹配的第五逻辑还要在单个处理器时钟周期内执行。4. 如权利要求1所述的处理器,还包括:第六逻辑,用于针对执行端口中的给定一个生成独热向量,所述向量包括位于将要被分派给给定执行端口的一个未决指令的索引的单个正位。5. 如权利要求1所述的处理器,还包括:第六逻辑,用于将未决指令存储在第一级中;第七逻辑,用于评估必要的数据是否可用于执行未决指令;第八逻辑,用于基于必要的数据可用于执行未决指令的评估使未决指令前进至第二级;和第九逻辑,用于将针对每个未决指令的有效性位存储在第二级中,有效性位指示各个股是否有效以及必要的数据是否可用于执行各未决指令。6. 如权利要求1所述的处理器,还包括:第六逻辑,用于执行每个未决指令的程序次序与其它未决指令的程序次序的矩阵比较并且将结果存储在逻辑矩阵中,每个未决指令由逻辑矩阵中的各个行表示,每个未决指令的优先级由各个行中的正位的量表示;和第七逻辑,用于调整逻辑矩阵中针对各未决指令中的每个未决指令的正位以产生与一个执行端口关联的修改的逻辑矩阵,调整基于各个股是否有效。7. 如权利要求6所述的处理器,还包括:第八逻辑,用于基于修改的逻辑矩阵和端口绑定信息产生独热分派向量,所述向量包括位于将要被分派给与修改的逻辑矩阵关联的一个执行端口的一个未决指令的索引的单个正位。8. 一种方法,所述方法包括在处理器内:获取指令流,所述指令流被划分为用于在一个或多个执行端口上加载的多个股;识别多个未决指令,每个未决指令位于一个股的各自的头;确定哪些股有效;确定每个未决指令的程序次序;以及基于每个未决指令的程序次序以及每个股是否有效将未决指令与执行端口进行匹配。9. 如权利要求8所述的方法,还包括:确定一个未决指令与一个执行端口的端口绑定;以及基于每个未决指令的程序次序、每个股是否有效以及端口绑定将未决指令与执行端口进行匹配。10. 如权利要求8所述的方法,其中在单个处理器时钟周期内执行将未决指令与执行端口进行匹配。11. 如权利要求8所述的方法,还包括:针对执行端口中的给定一个生成独热向量,所述向量包括位于将要被分派给给定执行...

【专利技术属性】
技术研发人员:J埃尔N科萨雷夫SY施什洛夫A西夫特索夫BA巴巴严AV布图佐夫
申请(专利权)人:英特尔公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1