当前位置: 首页 > 专利查询>英特尔公司专利>正文

异构处理器装置和方法制造方法及图纸

技术编号:12304850 阅读:61 留言:0更新日期:2015-11-11 14:03
描述了异构处理器架构。例如,根据本发明专利技术的一个实施例的处理器包括:具有第一处理特性的一个或多个物理处理器核的第一集合;具有不同于该第一处理特性的第二处理特性的一个或多个物理处理器核的第二集合;虚拟到物理(V-P)映射逻辑,用于将多个虚拟处理器暴露给软件,多个虚拟处理器对于软件就像是多个同构处理器核,该软件用于好像多个虚拟处理器是同构处理器核那样来将多个线程分配给多个虚拟处理器;其中,V-P映射逻辑用于将每一个虚拟处理器映射至物理处理器核的第一集合或物理处理器核的第二集合中的物理处理器,使得由软件分配给第一虚拟处理器的线程由从物理处理器的第一集合或第二集合被映射至第一虚拟处理器的物理处理器执行。

【技术实现步骤摘要】
【国外来华专利技术】【专利说明】
技术介绍

本专利技术总体涉及计算机处理器的领域。更具体地说,本专利技术涉及异构处理器装置 和方法。 相关抟术的描沐 异构计算架构提供相比同构架构的独特优势,因为多于一种类型的计算元件可用 于执行计算任务。不同的计算元件(也被称为"处理元件"或"功能单元")比其他元件更 适用于不同的任务。例如,计算元件A在运行任务X时比计算元件B快,但是该计算元件A 在运行任务V时可能比计算元件B慢。因此,包含计算元件A和B两者的硬件在运行任务 X和V的组合时比仅包含类型A或类型B的计算元件的硬件更高效。 尽管异构计算架构具有公知的优势,但现实世界中用于CPU核的异构计算的示例 却很少。这些架构要求软件知晓如何将多个任务适当地调度到每一种CPU核类型(在这种 情况下,计算元件是CPU核)。随着硬件演进以及核类型变化,让软件(例如,操作系统)跟 踪可用的不同类型的CPU核以及如何高效地利用异构性是非常困难的。出于这个原因,在 诸如Windows?和Linux之类的主流操作系统中没有核异构性支持,并且在不久的将来也不 大可能有针对该功能的广泛的支持。 【附图说明】 结合以下附图,从以下【具体实施方式】中可获得对本专利技术更好的理解,其中: 图IA是示出根据本专利技术的多个实施例的示例性有序流水线和示例性的寄存器重 命名的无序发布/执行流水线的框图; 图IB是示出根据本专利技术的多个实施例的要包括在处理器中的有序架构核的示例 性实施例和示例性的寄存器重命名的无序发布/执行架构核的框图; 图2是根据本专利技术的多个实施例的具有集成的存储器控制器和图形器件的单核 处理器和多核处理器的框图。 图3示出根据本专利技术的一个实施例的系统的框图; 图4示出根据本专利技术的实施例的第二系统的框图; 图5示出根据本专利技术的实施例的第三系统的框图; 图6示出根据本专利技术的实施例的芯片上系统(SoC)的框图; 图7示出根据本专利技术的多个实施例的、对照使用软件指令转换器将源指令集中的 二进制指令转换成目标指令集中的二进制指令的框图; 图8示出异构处理器架构的一个实施例。 图9A和9B分别示出包括被隐藏的大型核和被隐藏的小型核的实施例。 图10示出用于将虚拟核映射至物理核的方法的一个实施例。 图lla-b示出具有被隐藏的大型核和多个可见的小型核的系统的一个实施例。 图12示出用于将虚拟核映射至物理核的方法的一个实施例。 图13a_c示出具有被隐藏的小型核和多个可见的大型核的系统的一个实施例。 图13d示出用于不同类型的线程的核分配。 图14a_b示出用于智能地向异构处理器组件分配功率的本专利技术的多个实施例。 图15a_b是示出根据本专利技术的多个实施例的通用向量友好指令格式及其指令模 板的框图; 图16a_d是根据本专利技术的多个实施例的示例性专用向量友好指令格式的框图;以 及 图17是根据本专利技术的一个实施例的寄存器架构的框图。 【具体实施方式】 在下面的描述中,为了进行解释,阐述了众多具体细节以便提供对以下描述的本 专利技术的多个实施例的透彻理解。然而,对本领域技术人员显而易见的是,可以在没有这些具 体细节中的一些细节的情况下实施本专利技术的各实施例。在其他实例中,公知的结构和设备 以框图形式示出,以避免使本专利技术的多个实施例的基本原理模糊。 示例件处理器架构和数据类铟 图IA是示出根据本专利技术的多个实施例的示例性有序流水线和示例性的寄存器重 命名的无序发布/执行流水线的框图。图IB是示出根据本专利技术的多个实施例的要包括在 处理器中的有序架构核的示例性实施例和示例性的寄存器重命名的无序发布/执行架构 核的框图。图IA-B中的实线框示出了有序流水线和有序核,而可选增加的虚线框示出了寄 存器重命名的、无序发布/执行流水线和核。考虑到有序方面是无序方面的子集,将描述无 序方面。 在图IA中,处理器流水线100包括取出级102、长度解码级104、解码级106、分配 级108、重命名级110、调度(也被称为分派或发布)级112、寄存器读取/存储器读取级 114、执行级116、写回/存储器写入级118、异常处理级122和提交级124。 图IB示出处理器核190,其包括耦合到执行引擎单元150的前端单元130,且执行 引擎单元和前端单元两者都耦合到存储器单元170。核190可以是精简指令集计算(RISC) 核、复杂指令集计算(CISC)核、超长指令字(VLIW)核或混合或替代核类型。作为又一选项, 核190可以是专用核,诸如例如,网络或通信核、压缩引擎、协处理器核、通用计算图形处理 单元(GPGPU)核、图形核等。 前端单元130包括親合到指令高速缓存单元134的分支预测单元132,该指令高 速缓存单元耦合到指令转换后备缓冲器(TLB) 136,该指令转换后备缓冲器耦合到指令取出 单元138,指令取出单元耦合到解码单元140。解码单元140 (或解码器)可解码指令,并生 成从原始指令解码出的、或以其他方式反映原始指令的、或从原始指令导出的一个或多个 微操作、微代码进入点、微指令、其他指令或其他控制信号作为输出。解码单元140可使用 各种不同的机制来实现。合适机制的示例包括但不仅限于,查找表、硬件实现、可编程逻辑 阵列(PLA)、微代码只读存储器(ROM)等。在一个实施例中,核190包括微代码ROM或存储 用于某些宏指令的微代码的其他介质(例如,在解码单元140中或以其他方式在前端单元 130内)。解码单元140耦合至执行引擎单元150中的重命名/分配器单元152。 执行引擎单元150包括耦合到引退单元154和一个或多个调度器单元的集合156 的重命名/分配器单元152。调度器单元156表示任意数量的不同调度器,包括预留站、中 央指令窗等。调度器单元156耦合到物理寄存器组单元158。物理寄存器组单元158中的 每一个表示一个或多个物理寄存器组,其中不同的物理寄存器组存储一个或多个不同的数 据类型,例如,标量整数、标量浮点、紧缩整数、紧缩浮点、向量整数、向量浮点,状态(例如, 作为要被执行的下一条指令的地址的指令指针)等。在一个实施例中,物理寄存器组单元 158包括向量寄存器单元、写掩码寄存器单元和标量寄存器单元。这些寄存器单元可以提供 架构向量寄存器、向量掩码寄存器、和通用寄存器。物理寄存器组单元158被引退单元154 覆盖,以示出可实现寄存器重命名和无序执行的各种方式(例如,使用重排序缓冲器和引 退寄存器组;使用未来文件(future file)、历史缓冲器、引退寄存器组;使用寄存器映射 和寄存器池等)。引退单元154和物理寄存器组单元158耦合至执行群集160。执行群集 160包括一个或多个执行单元的集合162以及一个或多个存储器访问单元的集合164。执行 单元162可执行多种操作(例如,移位、加法、减法、乘法),并且可对多种数据类型(例如, 标量浮点、紧缩整数、紧缩浮点、向量整数、向量浮点)执行操作。尽管一些实施例可以包括 专用于特定功能或功能集的多个执行单元,但其他实施例可包括全部执行所有功能的仅一 个执行单元或多个执行单元。调度器单元156、物理寄存器组单元158、执行群集160被示 出为可能是复数个,因为某些实施例为某些数据/操作类型创建了诸个单独流水线(例如, 本文档来自技高网...

【技术保护点】
一种处理器,包括:具有第一处理特性的一个或多个物理处理器核的第一集合;具有不同于所述第一处理特性的第二处理特性的一个或多个物理处理器核的第二集合;虚拟到物理(V‑P)映射逻辑,用于将多个虚拟处理器暴露给软件,所述多个虚拟处理器对于所述软件就像是多个同构处理器核,所述软件用于好像所述多个虚拟处理器是同构处理器核那样来将多个线程分配给所述多个虚拟处理器;其中,所述V‑P映射逻辑用于将每一个虚拟处理器映射至物理处理器核的所述第一集合或物理处理器核的所述第二集合中的物理处理器,使得由所述软件分配给第一虚拟处理器的线程是由从物理处理器的所述第一集合或所述第二集合被映射至所述第一虚拟处理器的物理处理器执行。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:P·纳凡兹G·N·斯里尼瓦萨E·高巴托夫D·R·萨巴瑞迪M·奈克A·纳韦A·帕拉哈卡兰E·威斯曼D·A·考法蒂P·布莱特S·D·哈恩A·J·赫德瑞奇R·艾耶N·赤特罗I·M·索迪G·康纳R·J·芬格
申请(专利权)人:英特尔公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1