当前位置: 首页 > 专利查询>英特尔公司专利>正文

可切换拓扑机器制造技术

技术编号:21176366 阅读:26 留言:0更新日期:2019-05-22 12:06
实施例涉及包括管芯上的多个处理器分片的计算设备,该多个处理器分片可以具有多个可切换拓扑。计算设备的拓扑可以包括一个或多个虚拟电路。虚拟电路可以包括多个处理器分片。拓扑的虚拟电路的处理器分片可以包括配置向量,以控制处理器分片与相邻处理器分片之间的连接。计算设备的第一拓扑可以对应于程序的计算的第一阶段,并且计算设备的第二拓扑可以对应于程序的计算的第二阶段。可以描述和/或要求保护其他实施例。

Switchable Topology Machine

The embodiment relates to a computing device comprising a plurality of processor fragments on a core that may have multiple switchable topologies. The computing device's topology may include one or more virtual circuits. Virtual circuits can include multiple processor fragments. Processor fragmentation of a topological virtual circuit may include configuration vectors to control the connection between processor fragmentation and adjacent processor fragments. The first topology of the computing device can correspond to the first stage of program calculation, and the second topology of the computing device can correspond to the second stage of program calculation. Other embodiments may be described and/or required to be protected.

【技术实现步骤摘要】
【国外来华专利技术】可切换拓扑机器相关申请本申请要求享有于2017年6月29日提交的题为“SWITCHABLETOPOLOGYMACHINE”的美国申请15/637,581的优先权,该申请要求享有于2016年10月26日提交的题为“SwitchableTopologyMachine”的美国临时申请62/413,160的优先权。政府权利本公开是在政府支持下以与IntelFederalLLC的合同No.#H98230-13-D-0124完成的。合同可能已经由国防部(DoD)授予。政府在本公开中拥有一定的权利。
本公开的实施例总体上涉及计算
,并且更具体地涉及多个处理器分片的计算。
技术介绍
本文提供的背景描述是出于总体上呈现公开内容的上下文的目的。除非在本文中另有说明,否则本部分中描述的材料不是本申请中的权利要求的现有技术,并且不因包含在本部分中而被认为是现有技术。可以将管芯上的多核心或多核心芯片组织成处理器分片的一维阵列或二维阵列,其中每个处理器分片可以是处理器,或简称为分片。每个处理器分片可以是包括高速缓存和开关的计算单元、处理引擎或中央处理单元(CPU)。多个处理器分片可以根据拓扑彼此耦合。可以在管芯上形成大量处理器分片,例如,多于500个处理器分片。管芯上的大量处理器分片可能增加通信复杂度。此外,多个处理器分片的拓扑可以是固定的,并且在程序的计算期间不能改变。附图说明通过以下具体实施方式,结合附图,将容易理解实施例。为了有助于理解本说明书,相同的附图标记表示相同的结构元素。在附图的图中通过示例的方式而非通过限制的方式来说明实施例。图1示出了根据各种实施例的示例计算设备,其包括管芯上的多个处理器分片以及包括多个处理器分片的虚拟电路(VC)。图2示出了根据各种实施例的另一示例计算设备,其包括具有可切换的多个拓扑的管芯上的多个处理器分片。图3示出了根据各种实施例的示例处理器分片,其包括控制器、可编程互连和多个接口块。图4示出了根据各种实施例的处理器分片的示例控制器,其用于控制可编程互连与多个接口块之间的连接。图5示出了根据各种实施例的示例配置向量,其存储在处理器分片的存储器中以控制可编程互连与多个接口块之间的连接。图6示出了根据各种实施例的VC段在两个不同的处理器分片之间的示例形成。图7-8示出了根据各种实施例的在形成两个VC的过程期间的仲裁的示例。图9示出了根据各种实施例的处理器分片的控制器对可编程互连与多个接口块之间的连接进行控制的示例过程。图10示出了根据各种实施例的适用于实践本公开的各个方面的示例设备。图11示出了根据各种实施例的具有用于实践参考图1-10描述的方法的指令的存储介质。具体实施方式本文公开了与由包括具有可切换拓扑的管芯上的多个处理器分片的计算设备在多个阶段中执行程序的计算有关的装置、方法和存储介质。本文的实施例可以是具有数千个处理器分片的计算设备。在实施例中,虚拟电路(VC)可以包括多个处理器分片。消息分组可以在单个时钟周期中遍历VC的多个处理器分片。计算设备的拓扑可以包括形成通信模式的多个VC。拓扑对于某些计算任务可能是高效的,而对于某些其他计算任务则不那么高效。多个处理器分片被组织成在程序的计算期间不能改变的一个固定拓扑对于计算的多个阶段可能不是高效的。在实施例中,包括管芯上的多个处理器分片的计算设备可以具有多个可切换拓扑。第一拓扑可以对应于程序的计算的第一阶段,并且第二拓扑可以对应于程序的计算的第二阶段。当程序的计算从第一阶段转移到第二阶段时,计算设备可以从第一拓扑切换到第二拓扑,使得程序的计算的第一阶段可以由计算设备根据第一拓扑来执行,并且程序的计算的第二阶段可以由计算设备根据第二拓扑来执行。利用可切换拓扑,本文的实施例可以为程序的各种计算任务提供更高效的计算和通信。在实施例中,计算设备可以包括具有可切换拓扑的管芯上的多个处理器分片,其中计算设备的拓扑可以包括多个VC。第一拓扑的VC的处理器分片可以包括第一配置向量,并且第二拓扑的VC的处理器分片可以包括第二配置向量。处理器分片的配置向量可以表示包括处理器分片的VC段。第一拓扑可以对应于程序的计算的第一阶段,而第二拓扑可以对应于程序的计算的第二阶段,其中计算的第二阶段可以与计算的第一阶段不同。第一配置向量在程序的计算的第一阶段期间可以处于活动状态,而在计算的第二阶段期间可以处于非活动状态。类似地,第二配置向量在程序的计算的第一阶段期间可以处于非活动状态,而在计算的第二阶段期间可以处于活动状态。在实施例中,处理器分片可以包括多个接口块、可编程互连、存储器和控制器。存储器可以存储多个配置向量。控制器可以基于存储在存储器中的配置向量来控制可编程互连与多个接口块之间的连接。在下面的说明书中,参考形成其一部分的附图,在附图中相同的附图标记始终表示相同的部分,并且附图通过可以实践的说明性实施例的方式示出。应该理解,在不脱离本公开的范围的情况下可以利用其他实施例并且可以进行结构或逻辑改变。因此,以下具体实施方式不应被视为具有限制意义,并且实施例的范围由所附权利要求及其等同物限定。各种方法的操作可以以最有助于理解所要求保护的主题的方式依次描述为多个离散的动作或操作。然而,描述的次序不应被解释为暗指这些操作必须是次序相关的。特别地,这些操作可以不按照呈现的次序执行。所描述的操作可以以与所描述的实施例不同的次序来执行。在附加实施例中可以执行各种附加操作和/或可以省略、拆分或组合所描述的操作。出于本公开的目的,短语“A或B”以及“A和/或B”表示(A)、(B)或(A和B)。出于本公开的目的,短语“A、B和/或C”表示(A)、(B)、(C)、(A和B)、(A和C)、(B和C)或(A、B和C)。说明书可以使用短语“在一个实施例中”或“在实施例中”,其可以各自指代相同实施例或不同实施例中的一个或多个。此外,如关于本公开的实施例使用的术语“包括”、“包含”、“具有”等是同义的。如在下文中包括在权利要求书中所使用的,术语“模块”或“例程”可以指代以下各项,是以下各项的一部分或包括以下各项:专用集成电路(ASIC)、电子电路、执行一个或多个软件或固件程序的(共享的、专用的或组)处理器和/或(共享的、专用的或组)存储器、组合逻辑电路和/或提供所描述的功能的其他合适的部件。在公开内容叙述“一(a)”或“第一”元素或其等同物的情况下,这种公开包括一个或多个这样的元素,既不要求也不排除两个或更多个这样的元素。此外,除非另外专门陈述,否则针对识别出的元素的序数指示符(例如,第一、第二或第三)用于在元素之间进行区分,而不指示或暗示要求或限制数量的这种元素,也不指示这些元素的特定位置或次序。本文可以使用术语“与……耦合”和“耦合到”等。“耦合”可以表示以下中的一个或多个。“耦合”可以表示两个或更多个元件直接物理或电接触。然而,“耦合”还可以表示两个或更多个元件彼此间接接触,但仍然彼此协作或交互,并且可以表示一个或多个其他元件耦合或连接在所述彼此耦合的元件之间。通过示例而非限制的方式,“耦合”可以表示两个或更多个元件或设备通过诸如主板之类的印刷电路板上的电连接而耦合。通过示例而非限制的方式,“耦合”可以表示两个或更多个元件/设备通过诸如有线网络和/或无线网络之类的一个或本文档来自技高网...

【技术保护点】
1.一种管芯上的处理器分片,包括:多个接口块;可编程互连,其耦合到所述多个接口块;存储器,其用于存储表示包括所述处理器分片的虚拟电路(VC)段的多个配置向量;以及控制器,其耦合到所述多个接口块、所述存储器以及所述可编程互连,以基于存储在所述存储器中的所述多个配置向量来控制所述可编程互连与所述多个接口块之间的连接。

【技术特征摘要】
【国外来华专利技术】2016.10.26 US 62/413,160;2017.06.29 US 15/637,5811.一种管芯上的处理器分片,包括:多个接口块;可编程互连,其耦合到所述多个接口块;存储器,其用于存储表示包括所述处理器分片的虚拟电路(VC)段的多个配置向量;以及控制器,其耦合到所述多个接口块、所述存储器以及所述可编程互连,以基于存储在所述存储器中的所述多个配置向量来控制所述可编程互连与所述多个接口块之间的连接。2.根据权利要求1所述的处理器分片,其中,所述控制器用于:基于配置向量的优先级数,从所述多个配置向量中选择处于空闲状态的所述配置向量;基于对所述处理器分片的可用资源与针对所述配置向量的资源的比较,确定选定的配置向量处于发布就绪状态;将处于所述发布就绪状态的所述配置向量加载到所述可编程互连上,以将针对所述配置向量的资源映射到所述处理器分片的资源,使所述配置向量进入已加载状态;通过启用所述处理器分片与由所述配置向量确定的相邻处理器分片之间的连接,将处于所述已加载状态的所述配置向量激活以变为活动状态;以及针对所述配置向量释放所述处理器分片的资源,以将所述配置向量改变为已退出状态。3.根据权利要求2所述的处理器分片,其中,为了将处于所述已加载状态的所述配置向量激活以变为所述活动状态,所述控制器用于:使传出控制线上的代码生效,以指示所述配置向量处于所述已加载状态;检测传入控制线上的信号,以指示由所述配置向量确定的所述相邻处理器分片处于已加载状态;启用所述处理器分片与所述相邻处理器分片之间的所述连接,以将处于所述已加载状态的所述配置向量激活以变为所述活动状态。4.根据权利要求1-3中任一项所述的处理器分片,其中,所述处理器分片在程序的计算的第一阶段期间被包括在由存储在所述存储器中的第一配置向量确定的第一VC中,并且在所述程序的计算的第二阶段期间被包括在由存储在所述存储器中的第二配置向量确定的第二VC中。5.根据权利要求1-3中任一项所述的处理器分片,其中,所述处理器分片耦合到放置在东(E)方向、西(W)方向、东北(NE)方向、西北(NW)方向、东南(SE)方向以及西南(SW)方向的六个相邻处理器分片。6.根据权利要求1-3中任一项所述的处理器分片,其中,所述处理器分片是VC的传输节点,消息分组通过所述多个接口块中的第一接口块进入所述处理器分片,经过所述可编程互连,并且通过所述多个接口块中的第二接口块离开所述处理器分片。7.根据权利要求1-3中任一项所述的处理器分片,其中,所述处理器分片是VC的终端节点,并且消息分组通过所述多个接口块中的接口块进入所述处理器分片并且被存储在所述接口块的本地存储装置中。8.根据权利要求1-3中任一项所述的处理器分片,其中,所述多个配置向量中的配置向量与VC段相关,所述VC段包括耦合到第二处理器分片的所述处理器分片,并且所述VC段是无缓冲通道,消息分组通过所述无缓冲通道在所述处理器分片与所述第二处理器分片之间传递。9.根据权利要求1-3中任一项所述的处理器分片,其中,所述多个配置向量中的配置向量包括:VC的标识,拓扑的标识,所述配置向量的优先级数,所述处理器分片的要耦合到进入的相邻处理器分片的第一端口,以及所述处理器分片的要耦合到离开的相邻处理器分片的第二端口。10.根据权利要求1-3中任一项所述的处理器分片,其中,所述多个配置向量中的第一配置向量包括第一VC的标识和第一拓扑的标识,所述多个配置向量中的第二配置向量包括第二VC的标识和第二拓扑的标识,并且其中,所述第一拓扑对应于程序的计算的第一阶段,所述第二拓扑对应于所述程序的计算的第二阶段,所述计算的第二阶段与所述计算的第一阶段不同,并且所述第二拓扑与所述第一拓扑不同。11.一种计算设备,包括:管芯上的多个处理器分片;虚拟电路(VC),其包括所述多个处理器分片中的数个处理器分片,其中,消息分组在单个时钟周期中遍历所述VC的数个处理器分片;第一拓扑,其包括第一数量的VC,其中,所述第一拓扑对应于程序的计算的第一阶段,并且所述第一拓扑的第一VC的第一处理器分片包括第一配置向量;第二拓扑,其包括第二数量的VC,其中,所述第二拓扑对应于所述程序的计算的第二阶段,所述第二拓扑的第二VC的第一处理器分片包括第二配置向量,所述计算的第二阶段与所述计算的第一阶段不同,并且所述第二拓扑与所述第一拓扑不同;并且其中,被包括在所述第一拓扑的第一VC的第一处理器分片中的所述第一配置向量在所述程序的计算的第一阶段期间处于活动状态,所述第一配置向量在所述程序的计算的第二阶段期间处于非活动状态,被包括在所述第二拓扑的第二VC的第一处理器分片中的所述第二配置向量在所述程序的计算的第二阶段期间处于活动状态,并且所述第二配置向量在所述程序的计算的第一阶段期间处于非活动状态。12.根据权利要求11所述的计算设备,其中,所述第一拓扑的第一VC的第一处理器分片是所述第一VC的传输节点,所述第一处理器分片包括:第一接口块;第二接口块;以及可编程互连,其耦合到所述第一接口块和所述第二接口块,并且其中,所述计算的第一阶段的消息分组通过所述第一接口块进入所述第一处理器分片,经过所述可编程互连,并且通过所述第二接口块离开所述第一处理器分片。...

【专利技术属性】
技术研发人员:W·J·布泰拉S·C·小斯蒂利R·J·迪施勒
申请(专利权)人:英特尔公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1