处理器和计算机系统技术方案

技术编号:4136996 阅读:190 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种处理器和计算机系统。本发明专利技术的一个实施例提供了一种处理器。该处理器通常包括:第一和第二处理器核心,均具有多个流水线执行单元以便执行具有多个指令的发出组;以及调度逻辑,被配置为,当所述处理器处于第一操作模式时,向所述第一处理器核心发出指令的第一发出组以便执行,并且向所述第二处理器核心发出指令的第二发出组以便执行,以及被配置为,当所述处理器处于第二操作模式时,发出一个或多个矢量指令以便在所述第一和第二处理器核心上同时执行。

【技术实现步骤摘要】

概括地说,本专利技术涉及流水线处理器,更具体地,涉及利用执《亍单元 的级联排列的处理器,所述执行单元相对于彼此祐延迟。
技术介绍
典型地,计算机系统包含若干集成电路(IC),其包括用于处理计算才几系统中的信息的一个或多个处理器。现代处理器常常以流水线方式处理 指令,即作为一系列步骤来执行每个指令。典型地,由流水线中的不同级 (硬件电路)执行每个步骤,其中每个流水线级在给定时钟周期内执行其 与流水线中的不同指令相关的步骤。结果,如果流水线满载,则在每个时 钟周期处理一个指令,从而增加吞吐 量。作为简单实例,流水线可包括三个级加载(从存储器读取指令)、 执行(执行指令)、和存储(存储结果)。在第一时钟周期,第一指令进 入流水线加载级。在第二时钟周期,第一指令移动至执行级,释放加载级 以加载第二指令。在第三时钟周期,可通过存储M储执行第一指令的结果,同时执行第二指令并加载第三指令。不幸地,由于典型指令流中固有的依赖性,传统指令流水线在执行一 个指令的执行单元等待由先前指令的执行所生成的结果期间会遭遇到停滞(即流水线级不执行)。作为实例,加载指令可依赖于先前指令(例如另 一加载指令或增加对基地址的偏移)以提供要加载数据的地址。作为另一 实例,乘法指令可依赖于一个或多个先前加载指令的结果作为其操作数之 一。在任一情况下,传统指令流水线将停滞,直到先前指令的结果可用。 停滞可以是若干时钟周期,例如,如果(后续指令所依赖的)先前指令以4未驻留在L1高速緩存中的数据为目标(导致L1 高速緩存未命中)并 且必须访问相对较慢的L2高速緩存。结果,这种停滞由于流水线的未充 分利用而导致性能显著降低。因此,需要一种对指令流水线化的改进机制,用于优选地减少停滞。
技术实现思路
本专利技术的实施例提供了 一种用于矢量指令的执行的装置。 本专利技术的一个实施例提供了一种处理器。 一般地,该处理器包括第 一和第二处理器核心,均具有多个流水线执行单元以i更执行具有多个指令 的发出组;以及调度逻辑,被配置为,当所述处理器处于笫一操作模式时, 向所述第 一处理器核心发出指令的第一发出組以便执行,并且向所述第二 处理器核心发出指令的第二发出组以便执行,以及被配置为,当所述处理 器处于第二操作模式时,发出一个或多个矢量指令以^更在所述第一和第二 处理器核心上同时执行。本专利技术的另一实施例提供了一种计算系统。 一般地,该计算系统包括 第一和第二处理器,均具有多个处理器核心以便执行一个或多个矢量指令;以及调度逻辑,被配置为,当所述计算系统处于第一操作模式时,向所述 第一处理器发出一个或多个矢量指令以l更执行,并且向所述第二处理器发 出一个或多个矢量指令以便执行,以及净皮配置为,当所述计算系统处于第 二操作模式时,向所述第一和第二处理器发出具有矢量指令的发出组以便 执行。附图说明通过参照附图中所示的本专利技术实施例,可具有以上概述的本专利技术更具 体的描述,以便获得和详细理解本专利技术的上述特点、优点和目的。然而,应注意,附图仅示出本专利技术的典型实施例,因此不应理解为限 制本专利技术的范围,因为本专利技术可允许其他等效实施例。图l是示出才艮据本专利技术一个实施例的系统的框图;图2是示出根据本专利技术一个实施例的计算机处理器的框图; 图3是示出才艮据本专利技术一个实施例的处理器的核心之一的框图; 图4A和4B将传统流水线单元的性能与根据本专利技术实施例的流水线单 元相比较;图5示出根据本专利技术实施例的示例性整数级联延迟执行流水线单元; 图6是根据本专利技术实施例的调度和发出指令的示例性操作的流程图; 图7A-7D示出经过图5所示的流水线单元的指令流; 图8示出根据本专利技术实施例的示例性浮点级m迟执行流水线单元; 图9A-9D示出经过图5所示的流水线单元的指令流;图io示出才艮据本专利技术实施例的示例性矢量级m迟执行流水线单元;图11示出j吏得处理器的物理核心变形以对于不同应用呈现出不同的 实例;图12A和12B示出根据本专利技术实施例被变形为单个单元的示例性级联 延迟执行流水线单元;图13示出4吏得处理器的物理核心对于不同应用呈现出不同变形的另 一实例;图14示出4吏得处理器的物理核心对于不同应用呈现出不同变形的另 一实例;图15示出才艮据本专利技术一个实施例的实例物理布局(平面图);图16示出根据本专利技术一个实施例的另一实例平面图17示出对物理核心变形以用于矢量处理的实例;图18示出对物理核心变形以用于矢量处理的另一实例;图19示出根据本专利技术一个实施例的多芯片封装(MCP);图20示出被一起变形的多个CPU;以及图21示出可在各个CPU之间维持正确计时中采用的逻辑。M实施方式概括地说,本专利技术提供一种以流水线方式执行指令的改进技术,其可减少在执行依赖指令时发生的停滞。可通过利用具有执行单元的流水线的级联排列来减少停滞,所述执行单元相对于彼此,iu^迟。这种级联延迟排 列通过以下方式允许在公共发出组中发出依赖指令,即调度这些指令在不 同流水线中执行,以便在不同时间执行。作为实例,可调度第一指令以在第一 更早,,或更少延迟流水线 上执行,同时可调度第二指令(依赖于通过执行第一指令获得的结果)以 在第二 更晚或更多延迟,,流水线上执行。通过调度第二指令以在相 对于第一流水线延迟的流水线中执行,笫一指令的结果可以刚好在第二指 令要执行时及时可用。在第二指令的执行仍旧禎延迟直到第一指令的结果可用时,随后的发出组可在下一周期i^级联流水线,从而增加吞吐量。 换句话说,这种延迟^第一发出组中可见,并对于l^发出组是隐 藏的,从而允许在每个流水线周期发出不同发出组(即使具有依赖指令)。以下描述本专利技术的实施例。然而,应理解,本专利技术不限于具体描述的 实施例。相反,以下特征和元素的任意组合(无论是否与不同实施例相关) 都被构想为实现和执行本专利技术。此外,在各个实施例中,本专利技术提供相对 于现有技术的多种优点。然而,尽管本专利技术的实施例可实现相对于其他可 能方案和/或相对于现有技术的优点,但是给定实施例是否实现特定优点并 不限制本专利技术。因此,以下方面、特点、实施例和优点仅是示例性的,并 且不被认为是所附权利要求的元素或限制,除非在权利要求中明确引用。 同样,所提及的本专利技术不应理解为是在此公开的任意专利技术主题的概括, 并且不应认为是所附权利要求的元素或限制,除非在权利要求中明确引用。以下是在附图中描述的本专利技术实施例的具体实施方式。这些实施例是 实例,并且从细节上用于清楚地表达本专利技术。然而,所提供的细节数量并非旨在限制实施例的期望变型;相反,其旨在覆盖落入由所附权利要求限 定的本专利技术的精神和范围内的所有修改、等同物和替代物。本专利技术的实施例可通过并可相对于例如计算机系统的系统来使用和描 述。如在此使用的,系统可包括利用处理器和高速緩冲存储器的任意系统,包括个人计算机、互联网装置、数字媒体装置、便携式数字助理(PDA)、7便携式音乐/视频播放器和视频游戏控制台。尽管高速緩冲存储器可与利用 高速緩冲存储器的处理器位于同一管芯上,但是在一些情况下,处理器和 高速緩沖存储器可位于不同管芯上(例如,不同芯片在不同模块中,或不 同芯片在一个模块中)。示例性系统的概况图1是示出根据本专利技术一个实施例的系统100的框图。系统100可包 含系统存储器102,用于存储指本文档来自技高网
...

【技术保护点】
一种处理器,包括: 第一和第二处理器核心,均具有多个流水线执行单元以便执行具有多个指令的发出组;以及 调度逻辑,被配置为,当所述处理器处于第一操作模式时,向所述第一处理器核心发出指令的第一发出组以便执行,并且向所述第二处理器核心 发出指令的第二发出组以便执行;以及被配置为,当所述处理器处于第二操作模式时,发出一个或多个矢量指令以便在所述第一和第二处理器核心上同时执行。

【技术特征摘要】
US 2008-9-19 12/233,7291.一种处理器,包括第一和第二处理器核心,均具有多个流水线执行单元以便执行具有多个指令的发出组;以及调度逻辑,被配置为,当所述处理器处于第一操作模式时,向所述第一处理器核心发出指令的第一发出组以便执行,并且向所述第二处理器核心发出指令的第二发出组以便执行;以及被配置为,当所述处理器处于第二操作模式时,发出一个或多个矢量指令以便在所述第一和第二处理器核心上同时执行。2. 如权利要求l所述的处理器,其中所述第一和第二处理器核心均具有能够执行具有N个指令的发出组的N个流水线执行单元。3. 如权利要求1所述的处理器,其中所述第一和第二处理器核心均 包括流水线执行单元的级联,在所述处理器处于第一操作模式时,所述流 水线执行单元以相对于彼此延迟的方式执行公共发出组中的指令。4. 如权利要求3所述的处理器,其中在所述处理器处于第二操作模 式时,所述第 一和第二处理器核心的流水线执行单元以并行方式执行与矢 量指令对应的操作。5. 如权利要求4所述的处理器,其中所述第一和第二处理器核心包括目标延迟队列,在所述处理器处于第 一操作模式时,所述目标延迟队列允许以相对于彼此延迟的方式发出公共 发出组中的指令;以及在所述处理器处于第二操作模式时,所述目标延迟队列被分流。6. 如权利要求1所述的处理器,还包括可由软件指令控制以在所 述第 一和第二操作模式之间进行选择的机制。7. 如权利要求1所述的处理器,其中所述调度逻辑净皮配置为 向所述第一和第二处理器核心发送所述矢量指令...

【专利技术属性】
技术研发人员:DA卢伊克
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1