用于SDN控制器集群的稳健的节点故障检测机制制造技术

技术编号:27092745 阅读:54 留言:0更新日期:2021-01-25 18:27
一种由软件定义网络SDN网络中的第一控制器实现的监视第二控制器的运行状况的方法,其中,第一控制器和第二控制器是控制器集群的一部分,其中,该集群中的控制器在带内网络上与交换机通信,其中,该集群中的控制器在带外网络上彼此通信。该方法包括:响应于确定在带外网络上不能到达第二控制器,在带内网络上向交换机发送第一控制消息,其中,第一控制消息包括运行状况检查请求消息和使交换机向第二控制器发送运行状况检查请求消息的指令,其中,该交换机是在带内网络上具有与第一控制器和第二控制器的控制信道连接的指定交换机。第二控制器的控制信道连接的指定交换机。第二控制器的控制信道连接的指定交换机。

【技术实现步骤摘要】
【国外来华专利技术】用于SDN控制器集群的稳健的节点故障检测机制


[0001]本专利技术的实施例涉及软件定义网络(SDN)领域,并且更具体地,涉及监视控制器集群中的SDN控制器的运行状况。

技术介绍

[0002]软件定义网络(SDN)是一种计算机联网的方法,该方法采用其中转发(数据)平面与控制平面解耦的分离架构网络。使用分离架构网络通过将网络的智能转移到监督交换机的一个或多个控制器中而简化了实现转发平面的网络设备(例如交换机)。SDN通过提供可编程的网络基础设施而促进了网络层处的快速和开放式创新。
[0003]SDN网络通常包括监督多个交换机的一个或多个控制器。控制器可以对交换机进行编程来实现期望的转发行为。SDN网络中的控制器可以形成集群,以便与单个控制器相比提供高可用性、高可靠性、以及高可伸缩性。集群中的控制器可以在带内网络上与SDN网络中的交换机进行通信(例如,以使用南向通信协议(例如OpenFlow)在控制信道上交换控制平面信息),而集群中的控制器可以在与带内网络相分离的专用带外网络上彼此通信。集群中的控制器可以在带外路径上进行通信来执行与集群相关的各种管理功能。例如,集群中的控制器可以在带外网络上进行通信来监视集群中的其他控制器的运行状况,并且如果确定集群中的控制器已发生故障,则发起适当的切换和重新分配(例如,如果集群中的控制器发生故障,则发生故障的控制器的工作负载可以被重新分配给集群中的其他控制器)。集群可以使用各种运行状况监视算法来确定集群中的控制器的运行状况。例如,一种算法可以保留基于从集群中的其他控制器接收的心跳消息而计算的故障统计信息的历史。然后,该算法可以分析故障统计信息来确定特定控制器是否具有故障。该算法可以基于各种不同的因素来计算表示特定控制器具有故障的可能性的phi值,而不是仅返回简单的“是”或“否”答案。
[0004]但是,使用现有的运行状况监视解决方案,当在带外网络上不能到达控制器时,不可能可靠地确定这是由于控制器具有故障还是带外网络具有故障。例如,如果第一控制器停止从第二控制器接收心跳消息,则第一控制器不能确定是第二控制器本身具有故障还是带外网络具有故障。

技术实现思路

[0005]一种由软件定义网络SDN网络中的第一控制器实现的监视第二控制器的运行状况的方法,其中,所述第一控制器和所述第二控制器是控制器集群的一部分,其中,所述集群中的控制器在带内网络上与所述SDN网络中的交换机通信,其中,所述集群中的控制器在与所述带内网络分离的带外网络上彼此通信。所述方法包括:确定在所述带外网络上不能到达所述第二控制器;以及响应于确定在所述带外网络上不能到达所述第二控制器,在所述带内网络上向交换机发送第一控制消息,其中,所述第一控制消息包括运行状况检查请求消息和使所述交换机向所述第二控制器发送所述运行状况检查请求消息的指令,其中,所
述交换机是在所述带内网络上具有与所述第一控制器和所述第二控制器的控制信道连接的指定交换机。
[0006]一种网络设备,被配置为用作软件定义网络SDN网络中的第一控制器以监视第二控制器的运行状况,其中,所述第一控制器和所述第二控制器是控制器集群的一部分,其中,所述集群中的控制器在带内网络上与所述SDN网络中的交换机通信,其中,所述集群中的控制器在与所述带内网络分离的带外网络上彼此通信。所述网络设备包括一组一个或多个处理器以及在其中存储监视组件的非暂时性机器可读存储介质。所述监视组件在由所述一组一个或多个处理器执行时使得所述网络设备:确定在所述带外网络上不能到达所述第二控制器;以及响应于确定在所述带外网络上不能到达所述第二控制器,在所述带内网络上向交换机发送第一控制消息,其中,所述第一控制消息包括运行状况检查请求消息和使所述交换机向所述第二控制器发送所述运行状况检查请求消息的指令,其中,所述交换机是在所述带内网络上具有与所述第一控制器和所述第二控制器的控制信道连接的指定交换机。
[0007]一种非暂时性机器可读介质,其中存储有计算机代码,所述计算机代码在由用作软件定义网络SDN网络中的第一控制器的网络设备的一组一个或多个处理器执行时,使得所述第一控制器执行用于监视第二控制器的操作,其中,所述第一控制器和所述第二控制器是控制器集群的一部分,其中,所述集群中的控制器在专用于控制器到控制器通信的带外网络上彼此通信,其中,所述集群中的控制器在与所述带外网络分离的带内网络上与所述SDN网络中的交换机通信。所述操作包括:确定在所述带外网络上不能到达所述第二控制器;以及响应于确定在所述带外网络上不能到达所述第二控制器,在所述带内网络上向交换机发送第一控制消息,其中,所述第一控制消息包括运行状况检查请求消息和使所述交换机向所述第二控制器发送所述运行状况检查请求消息的指令,其中,所述交换机是在所述带内网络上具有与所述第一控制器和所述第二控制器的控制信道连接的指定交换机。
附图说明
[0008]通过参考以下说明书和用于例示本专利技术实施例的附图,可以最好地理解本专利技术。在附图中:
[0009]图1是根据一些实施例的其中能够在带内网络上监视集群中的控制器的运行状况的SDN网络的框图;
[0010]图2是示出根据一些实施例的用于在带内网络上监视集群中的控制器的运行状况的消息传送序列的框图;
[0011]图3是根据一些实施例的在SDN网络中用于在带内网络上监视集群中的控制器的运行状况的过程的流程图;
[0012]图4是根据一些实施例的在SDN网络中用于支持在带内网络上的控制器运行状况监视的过程的流程图;
[0013]图5A示出了根据一些实施例的示例性网络内的网络设备(ND)之间的连接性以及ND的三个示例性实现;
[0014]图5B示出了根据一些实施例的实现专用网络设备的示例性方式;
[0015]图5C示出了根据一些实施例的在其中可以耦接虚拟网元(VNE)的各种示例性方
式;
[0016]图5D示出了根据一些实施例的在每个ND上具有单个网元(NE)的网络,并且在该直接方法内,将传统的分布式方法(通常由传统路由器使用)与用于维护可达性和转发信息(也称为网络控制)的集中式方法进行了对比;
[0017]图5E示出了根据一些实施例的其中每个ND都实现单个NE但是集中式控制平面已经将不同ND中的多个NE抽象成(表示)虚拟网络之一中的单个NE的简单情况;
[0018]图5F示出了根据一些实施例的其中多个VNE在不同ND上被实现并相互耦接并且其中集中式控制平面已将这些多个VNE抽象化以使得它们在虚拟网络之一中表现为单个VNE的情况;
[0019]图6示出了根据一些实施例的具有集中式控制平面(CCP)软件650的通用控制平面设备。
具体实施方式
[0020]以下说明描述了用于监视控制器集群中的SDN控制器的运行状况的方法和装置。在下面的说明书中,阐述了许多特定的细节(例如逻辑实现、操作码、指定操作数的手段、资源分区/共享/复制实现、系统组件的类型和相互关系以及逻辑分区/集成选择)以提供对本专利技术的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种由软件定义网络SDN网络中的第一控制器监视第二控制器的运行状况的方法,其中,所述第一控制器和所述第二控制器是控制器集群的一部分,其中,所述集群中的控制器在带内网络上与所述SDN网络中的交换机通信,其中,所述集群中的控制器在与所述带内网络分离的带外网络上彼此通信,所述方法包括:确定(310)在所述带外网络上不能到达所述第二控制器;以及响应于确定在所述带外网络上不能到达所述第二控制器,在所述带内网络上向交换机发送(320)第一控制消息,其中,所述第一控制消息包括运行状况检查请求消息和使所述交换机向所述第二控制器发送所述运行状况检查请求消息的指令,其中,所述交换机是在所述带内网络上具有与所述第一控制器和所述第二控制器的控制信道连接的指定交换机。2.根据权利要求1所述的方法,还包括:确定(330)是否已在所述带内网络上从所述第二控制器接收到运行状况检查确认消息。3.根据权利要求2所述的方法,还包括:响应于确定已在所述带内网络上从所述第二控制器接收到所述运行状况检查确认消息,确定(340)所述带外网络具有故障。4.根据权利要求3所述的方法,其中,所述运行状况检查确认消息被包括在由所述交换机在所述带内网络上发送到所述第一控制器的第二控制消息中。5.根据权利要求4所述的方法,其中,所述第一控制器和所述交换机使用南向通信协议在所述带内网络上通信。6.根据权利要求5所述的方法,其中,所述南向通信协议是OpenFlow。7.根据权利要求6所述的方法,其中,所述第一控制消息是Packet-Out消息,所述第二控制消息是Packet-In消息。8.根据权利要求2所述的方法,还包括:响应于确定尚未在所述带内网络上从所述第二控制器接收到所述运行状况检查确认消息,确定(350)所述第二控制器具有故障。9.根据权利要求1所述的方法,还包括:在所述带内网络上从所述交换机接收(410)第二控制消息,其中,所述第二控制消息包括由所述集群中的第三控制器生成的运行状况检查请求消息,其中,所述交换机具有与所述第三控制器的控制信道连接;以及响应于接收到所述第二控制消息,在所述带内网络上向所述交换机发送(420)第三控制消息,其中,所述第三控制消息包括运行状况检查确认消息和使所述交换机向所述第三控制器发送所述运行状况检查确认消息的指令。10.根据权利要求1所述的方法,还包括:将所述交换机标识为指定交换机;以及将所述交换机配置为建立与所述集群中的所有控制器的控制信道连接。11.一种网络设备(604),用作软件定义网络SDN网络中的第一控制器以监视第二控制器的运行状况,其中,所述第一控制器和所述第二控制器是控制器集群的一部分,其中,所述集群中的控制器在带内网络上与所述SDN网络中的交换机通信,其中,所述集群中的控制器在与所述带内网络分离的带外网络上彼此通信,所述网络设备包括:
一组一个或多个处理器(642);以及非暂时性机器可读存储介质(648),其中存储有监视组件(651),所述监视组件在由所述一组一个或多个处理器执行时使得所述第一控制器:确定在所述带外网络上不能到达所述第二控制器;以及响应于确定在所述带外网络上不能到达所述第二控制器,在所述带内网络上向交换机发送第一控制消息,其中,所述第一控制消息包括运行状况检查请求消息和使所述交换机向所述第二控制器发送所述运行状况检查请求消息的指令,其中,所述交换机是在所述带内网络上具有与所述第一控制器和所述第二控制器的控制信道连接的指定交换机。12.根据权利要求11所述的网络设备,其中,所述监视组件在由所述一组一个或多个处理器执行时还使得所述第一控制器:确定是否已在所述带内网络上从所述第二控制器接收到运行状况检查确认消息。13.根据权利要求12所述的网络设备,其中,所述监视组件在由所述一组一个或多个处理器执行时还使得所述...

【专利技术属性】
技术研发人员:F
申请(专利权)人:瑞典爱立信有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1