使用元胞自动机的群集服务器配置制造技术

技术编号:15201501 阅读:90 留言:0更新日期:2017-04-22 04:14
在系统复位或其他配置事件之后配置群集计算机服务器[100]。为了配置的目的,所述群集计算服务器的结构的每个节点[101、102]用作元胞自动机中的元胞,由此避免了对于用于从中央管理单元传递配置信息的特殊配置网络的需要。实际上,所述节点使用在所述节点处的软件服务的正常执行期间用于传递消息的相同结构互连[112]来传递配置信息。

Cluster server configuration using cellular automata

Configure cluster computer server [100] after system reset or other configuration events. For the purpose of configuration, the cluster, each node of the [101 102] server used for structure calculation of cellular automaton in, thus avoiding the need for special configuration for network transmission configuration information from the central management unit. In fact, the node uses the same structure interconnection [112] to deliver the configuration information during the normal execution of the software service at the node.

【技术实现步骤摘要】
【国外来华专利技术】公开背景领域本公开大体涉及处理系统,并且更具体地涉及群集服务器的配置。现有技术描述有时使用通过一个或多个结构互连连接在一起的计算节点来实现诸如服务器系统的高性能计算系统。计算节点执行软件程序以便执行指定的服务,诸如文件管理、数据库管理、文档打印管理、网页存储和呈现、计算机游戏服务等、或其组合。多个计算节点有助于处理相对大量的数据,同时还有助于计算系统的直接建立和缩放。结构互连为计算节点之间的通信提供骨干,并且因此可具有对处理器性能的重大影响。为了在系统复位之后使用结构互连,计算节点通常必须配置有实现结构互连的通信方案的地址表和路由表。附图简述通过参考附图,可更好地理解本公开,并且它的许多特征和优点对本领域技术人员来说变得显而易见。在不同图示中相同参考符号的使用指示类似或相同的物件。图1是根据一些实施方案的群集计算服务器的框图。图2是示出根据一些实施方案的针对群集计算服务器实现的示例性网络拓扑的框图。图3是示出根据一些实施方案的示例性计算节点以及所述计算节点与图2的网络拓扑中的其连接的计算节点的维度关系的框图。图4是示出根据一些实施方案的群集计算服务器的计算节点的配置状态字段的框图。图5是示出根据一些实施方案的图4的一个配置状态字段的配置状态集合的框图。图6是根据一些实施方案的配置群集计算服务器的结构的方法的流程图。图7是示出根据一些实施方案的包括管理单元节点的群集计算服务器的示例性结构拓扑的框图。图8是示出根据一些实施方案的图4的节点在配置期间的状态转换的框图。图9是示出根据一些实施方案的由群集计算服务器的节点自组织的示例性生成树的框图。图10是示出根据一些实施方案的在图8的生成树上传递CHAIN型配置消息的实例的框图。图11是示出根据一些实施方案的在图8的生成树上传递CHAIN型配置消息的实例的框图。图12是示出根据一些实施方案的群集计算服务器的节点的示例性物理布置的框图。图13是示出根据一些实施方案的群集计算服务器的计算节点的示例性实现方式的框图。图14是示出根据一些实施方案的用于设计和制造集成电路(IC)装置的方法的流程图。实施方案详述图1-14示出用于在系统复位或其他配置事件之后配置群集计算服务器的结构的技术。为了配置的目的,将结构的每个节点用作元胞自动机中的元胞,由此避免了对于用于从中央管理单元传递配置信息的特殊配置网络的需要。实际上,节点使用用于在节点处的软件服务的正常执行期间传递消息的相同结构互连来传递配置信息,而不需要提前根据固定拓扑预配置用于网络路由选择的结构互连。这降低了服务器复杂性,并且提供了群集计算服务器的更好可扩展性。为了说明,群集计算服务器采用结构互连来连接其各个节点。在正常操作期间,当计算节点执行软件服务时,每个节点能够将单播消息传递到服务器的每个其他节点是有用的,从而改善软件服务的整体服务器效率和质量。因此,在正常操作期间,计算服务器的结构实现消息路由选择方案,由此每个节点在结构中具有固定地址,并且本地存储描述消息路由选择方案的路由选择规则的路由选择信息(例如,路由表)。因为结构拓扑可能由于单独计算节点处的错误或故障而随时间改变,所以在每个计算节点处永久地存储固定的路由选择信息通常是不可行的。此类拓扑变化将使大部分固定的路由选择信息无效,从而降低服务器性能。因此,计算服务器在每次系统复位之后配置结构是有用的,由此在配置结构期间:1)识别由结构的功能节点所限定的结构拓扑,以及2)向每个功能节点分配唯一的地址和路由选择信息。此过程在本文中被称为计算服务器的“配置”(或结构的配置)。为了执行配置,常规的群集计算服务器通常采用“带外”网络,所述“带外”网络与用于在正常操作期间在节点之间传递消息的结构互连分开。然而,在具有许多计算节点的服务器系统中,带外网络需要大量时间来分配节点地址和路由选择信息,并且另外配置每个结构节点。此外,带外网络自身必须具有用于将所有配置消息路由到单独节点的基础结构,从而增加了计算服务器的复杂性和成本。与常规的计算服务器相反,本文所公开的技术提供一种群集计算服务器,其通过在每个计算节点处并入用于存储一组定义的配置字段的寄存器或其他存储结构来传递节点地址、路由选择信息和其他配置信息,由此每个字段可呈现任何有限的一组对应状态。在限定的时间间隔(在此称为配置周期)中,服务器的每个节点基于配置字段的先前状态以及基于通过结构互连而连接到所述节点的每个其他节点处的对应配置字段的状态,设置其每个配置字段的状态(保持在其先前状态或演进到新状态)。基于其配置字段的状态,节点将执行与配置字段的状态相关联的一个或多组预定义的、存储的配置指令。因此,配置字段限定在计算节点处执行的一个或多个任务,并且仅取决于在其连接的节点的配置寄存器处的对应字段的状态。因此,本文所公开的群集计算服务器不需要采用带外配置网络,从而简化计算服务器设计并且允许更快地配置大数目的计算节点。实际上,本文所公开的技术通过基于相邻节点中的状态变化分配配置信息来创建虚拟带外网络。在一些实施方案中,计算节点处的改变状态针对群集计算服务器执行至少两个配置操作:拓扑分析和配置消息的传递。对于拓扑分析,计算节点的配置字段的状态演进,以使得1)检测并准备功能计算节点以用于配置消息的传递;以及2)计算节点自组织成生成树。一旦已经组织生成树,结构节点就可传递配置消息,其中节点根据消息类型所暗示的分配规则将消息分配到其连接的节点。群集计算服务器的一个或多个管理单元通过在生成树的根计算节点处初始化配置消息来注入配置信息,并且每个节点处的分配规则致使消息到达生成树中的每一个计算节点。管理单元从而可分配诸如路由表、节点地址信息等的配置信息以便使节点准备正常操作。在一些情况下,群集计算服务器可响应于所限定的错误条件(诸如检测到生成树中的故障计算节点)重新进行拓扑分析。然后,计算节点将通过使对应配置字段自动返回对应拓扑分析状态并且重整生成生成树来调整生成树拓扑。因此,计算节点可针对单独计算节点处的故障和其他错误自动地进行调整。为了便于说明,在如以下参照图1-12描述的群集计算服务器的示例性上下文中描述服务器的配置。此类服务器的实例包括可购自AdvancedMicroDevices公司的SeaMicro(TM)部门的SM10000系列或SM15000系列的服务器。尽管以下描述了概述,但是在美国专利号7,925,802和8,140,719中发现关于群集计算服务器的实施方案的附加细节,所述专利申请的全部内容通过引用并入本文。本文所描述的技术不限于此示例性上下文,实际上可在各种服务器中的任一个中实现。此外,虽然在采用MAC地址的以太网实现方式的上下文中描述这些技术,但是这些技术可在各种链路层协议和寻址方案中的任何一个中实现。图1示出根据一些实施方案的群集计算服务器100。在本文中被称为“服务器100”的群集计算服务器100包括在机架单元(RU)系统中将计算、存储、交换和服务器管理汇集在一起的数据中心平台。服务器100基于通过结构互连112链接在一起的独立低功率计算节点(例如,计算节点101-106)、存储节点(例如,存储节点107-109)、网络节点(例如,网络节点110和111)和管理节点(例如,管理单元113)的并行阵列,所本文档来自技高网...
使用元胞自动机的群集服务器配置

【技术保护点】
一种服务器系统[100],其包括:结构互连[112],其用于在软件服务的执行期间路由消息;多个计算节点[101、102],其耦接到所述结构互连以便执行用于所述服务器系统的服务,所述多个计算节点中的每一个被配置为元胞自动机中的元胞以便使用所述结构互连来传递配置信息[401、402、403、404、405]。

【技术特征摘要】
【国外来华专利技术】2014.08.18 US 14/461,6141.一种服务器系统[100],其包括:结构互连[112],其用于在软件服务的执行期间路由消息;多个计算节点[101、102],其耦接到所述结构互连以便执行用于所述服务器系统的服务,所述多个计算节点中的每一个被配置为元胞自动机中的元胞以便使用所述结构互连来传递配置信息[401、402、403、404、405]。2.如权利要求1所述的服务器系统,其中所述多个计算节点中的每一个用于:响应于在连接的计算节点处的对应状态字段的状态[502、503]中的转换,在预定状态集合中的状态字段集合中进行转换;基于所述状态字段集合的所述转换来接收路由选择信息[610];并且基于所述路由选择信息,通过所述结构互连向所述多个计算节点中的其他计算节点路由接收到的消息[612]。3.如权利要求2所述的服务器系统,其中所述多个计算节点中的每一个用于:基于所述状态字段集合中的所述转换,识别所述计算节点相对于其连接的计算节点中的一个或多个在生成树中的位置[608]。4.如权利要求3所述的服务器系统,其中所述多个计算节点中的每一个用于:基于所述生成树,通过所述结构互连向连接的计算节点传递路由选择信息,所述传递基于所述状态字段集合中的所述转换[610]。5.如权利要求3所述的服务器系统,其中所述多个计算节点中的至少一个用于:响应于接收第一类型的消息:基于所述状态字段集合中的所述转换,相对于所述至少一个计算节点在所述生成树中的位置,将所述第一类型的所述消息传递到所述生成树中的多个远侧节点中的所选择的第一远侧节点[1001、1002、1003]。6.如权利要求5所述的服务器系统,其中所述多个计算节点中的所述至少一个用于:响应于随后从所述多个远侧节点中的所选择的第一远侧节点接收所述第一类型的所述消息:基于所述状态字段集合中的所述转换,将所述第一类型的所述消息传递到所述多个远侧节点中的所选择的第二远侧节点[1004、1005]。7.如权利要求6所述的服务器系统,其中所述多个计算节点中的所述至少一个用于:响应于随后从所述多个远侧...

【专利技术属性】
技术研发人员:迈克尔·E·詹姆斯珍菲利浦·弗里克
申请(专利权)人:超威半导体公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1