【技术实现步骤摘要】
用于处理分层网络拓扑中的多个本地链路故障的无死锁本地重新路由
[0001]本专利技术总体上涉及通信网络,并且具体地涉及用于在链路故障的情况下重新路由网络业务的方法和系统。
技术介绍
[0002]在诸如高性能计算(HPC)系统和数据中心等应用中使用的通信网络通常包括通过链路互连的大量网元。高可靠性的通信网络应该能够从链路故障事件中快速恢复。
[0003]从链路故障中恢复的方法在本领域中是已知的。例如,技术(2018)的白皮书描述了一种称为SHIELD
TM
(智能数据中心的自我修复互连增强)的解决方案,该解决方案利用了最新一代InfiniBand(无限带宽)交换机中内置的智能。通过使结构能够自主自我修复,通信的速度在面对链路故障时可以被纠正加快5000倍,速度足够快以避免昂贵的重传或绝对故障的通信。
[0004]例如,在美国专利9,729,473中描述了SHIELD解决方案的各个方面,该专利描述了一种网元中的方法,该网元包括用于连接到通信网络的多个接口。该方法包括经由入口接口接收不被允许经历重新 ...
【技术保护点】
【技术特征摘要】
1.一种用于通信的方法,包括:配置用于在包括通过中继链路互连的多个子网络的网络中传递数据分组的主路由,每个子网络包括多个交换机,所述交换机被配置为经由至少第一虚拟通道和第二虚拟通道进行通信,并被布置在包括包含上层交换机的上层和包含下层交换机的下层的二分拓扑中,所述上层交换机被连接到所述中继链路中的一个或更多个,所述下层交换机通过本地链路被连接到所述上层交换机;将每个子网络中的所述本地链路划分为至少第一组和第二组;对于所述主路由中的一个或更多个的一部分并将第一上层交换机连接到给定子网络中的第一下层交换机的每个本地链路,定义如下的对应迂回路由:在所述给定子网络内从所述第一上层交换机经过属于所述第一组的第一本地链路到第二下层交换机,并从所述第二下层交换机通过第二本地链路到所述给定子网络中的第二上层交换机,并从所述第二上层交换机通过属于所述第二组的第三本地链路到所述第一下层交换机;以及在连接所述第一上层交换机至所述第一下层交换机的所述本地链路发生故障时,重新路由到达所述第一上层交换机的所述数据分组,以传输到所述第一下层交换机,使得所述数据分组经过所述对应迂回路由到达所述第一下层交换机,同时经由所述第二虚拟通道通过所述第二本地链路和所述第三本地链路传输所述数据分组。2.根据权利要求1所述的方法,其中所述下层交换机包括叶交换机,并且所述方法包括将在所述给定子网络中接收到的所述数据分组经由所述迂回路由传递到与所述第一下层交换机连接的网络端节点。3.根据权利要求1所述的方法,其中划分每个子网络中的所述链路包括:定义第三组链路,其中定义所述对应迂回路由包括:针对被发往连接到所述给定子网络的网络端节点的所述数据分组配置通过所述第一组链路和所述第二组链路的迂回路由,以及其中所述方法包括:定义至少一个直通路由,通过所述至少一个直通路由,数据分组经由所述第一虚拟通道通过第一中继链路进入所述子网络到达所述子网络中的所述上层交换机之一,经过所述第三组中的所述链路之一到达所述子网络中的所述下层交换机之一,并经由所述第二虚拟通道经过所述链路中的另一条链路到达所述子网络中的另一个上层交换机,所述数据分组从所述另一个上层交换机通过第二中继链路离开所述子网络。4.根据权利要求1所述的方法,其中定义所述对应迂回路由包括:定义多个迂回路由以便在所述给定子网络中的所述本地链路中的多个本地链路发生故障的情况下使用。5.根据权利要求1所述的方法,其中定义所述对应迂回路由包括:对于任何给定本地链路,在通过所述给定本地链路是其一部分的多个所述主路由中的任何主路由重新路由到达所述给定子网络的所述数据分组中,应用所述对应迂回路由,使得即使所述给定本地链路发生故障,所述主路由也继续经过所述第一上层交换机。6.根据权利要求5所述的方法,其中配置所述主路由包括定义自适应路由组,所述自适应路由组包括发往所述给定子网络的所述主路由,而与所述主路由所指向的所述下层交换机无关,使得在所述给定子网络内的任何所述本地链路一发生故障时,所述自适应路由组中的所述主路由通过所述给定子网络内的迂回路由而被重新路由。7.一种通信系统,包括:
包括通过中继链路互连的多个子网络的网络,每个子网络包括多个交换机,所述交换机被配置为经由至少第一虚拟通道和第二虚拟通道进行通信,并且被布置在包括包含上层交换机的上层和包含下层交换机的下层的二分拓扑中,所述上层交换机被连接到所述中继链路中的一个或更多个,所述下层交换机通过本地链路被连接到所述上层交换机;以及管理处理器,其被配置为定义用于在所述网络中传递数据分组的主路由,将每个子网络中的所述本地链路划分为至少第一组和第二组,并且对于所述主路由中的一个或更多个的一部分并将第一上层交换机连接到给定子网络中的第一下层交换机的每个本地链路,定义如下的对应迂回路由:在所述给定子网络内从所述第一上层交换机经过属于所述第一组的第一本地链路到第二下层交换机,并从所述第二下层交换机通过第二本地链路到所述给定子网络中的第二上层交换机,并从所述第二上层交换机通过属于所述第二组的第三本地链路到所述第一下层交换机,其中所述给定子网络中的交换机被配置为:在连接所述第一上层交换机至所述第一下层交换机的所述本地链路发生故障时,重新路由到达所述第一上层交换机的所述数据分组,以传输到所述第一下层交换机,使得所述数据分组经过所述对应迂回路由到达所述第一下层交换机,同时经由所述第二虚拟通道通过所述第二本地链路和所述第三本地链路传输所述数据分组。8.根据权利要求7所述的系统,其中所述下层交换机包括叶交换机,所述叶交换机被配置为将在所述给定子网络中接收到的所述数据分组经由所述迂...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。