一种网络故障处理方法和处理系统技术方案

技术编号:13769683 阅读:53 留言:0更新日期:2016-09-29 07:04
一种网络故障处理方法和处理系统,所述方法包括以下步骤:A、根据网络拓扑和策略需求构建备份路径;B、根据网络中交换机的可用资源(TCAM)情况合理分配备份流表,使得每个流的故障需求都能够得到满足。所述处理系统包括交换机和控制器,控制器包括网络状态获取模块、备份路径生成模块、备份流表分配模块、备份流表下发模块、故障响应模块和备份路径更新模块。本发明专利技术的网络故障处理方法和处理系统将故障保护和故障恢复结合起来,能够进行细粒度的网络资源分配,从流的级别保证服务质量,在处理故障的同时保证网络策略的正确执行。

【技术实现步骤摘要】

本专利技术涉及计算机网络领域,特别是涉及一种网络故障处理方法和处理系统
技术介绍
自20世纪70年代诞生以来,计算机网络经历了飞速的发展。Internet的成功普及使得网络的应用范围从传统的军事、科研等领域走向生活的方方面面。随着信息时代的到来,网络的作用逐渐突起,网络的可靠性与稳定变得尤为重要。调查发现,可达性、吞吐量及延迟是目前网络的主要症结。而造成这些症结的主要原因就是链路故障。另外,不同应用(Email,Video等)对网络的需求并不相同,所以提出一种有效应对链路故障的解决方案变得十分紧迫。当前网络正在进行着与个人PC(Personal Computer)相同的演变:从软硬件一体化逐渐发展到软件与硬件相互分离。事实证明,早期的软硬件一体化有利于网络的快速构建与大规模应用,但是随着网络的规模的逐渐扩大,这种一体化模式限制了网络的发展,网络管理的灵活性变得越来越重要。SDN(Software Defined Networking)应运而生,它通过将控制平面(Control Plane)和转发平面(Forwarding Plane)分离和对转发平面的集中控制来简化网络管理,使得网络管理的灵活性大大增强。相对于传统网络,SDN网络的特点如下:1)SDN是一种新的网络管理范式,它将控制平面从传统的路由器中抽离,使得复杂的“路由器”变成了简单的“交换机”。即,它通过将数据面板和控制面板解耦来降低交换机的复杂度,使得在实时网络中测试新开发的协议成为可能。2)在SDN网络中,主要的“智能部件”都集中在控制器中,底层的交换机变得十分简单。控制器负责实现传统网络的各种协议功能(OSPF,BGP,LLDP,VLAN等),通过南向标准协议(如OpenFlow)与底层的交换机通讯,将生成的流表下发到交换机之中;底层的交换机负责执行转发功能,当它收到数据包之后,它将查询流表,匹配数据包的头部,根据匹配的结果执
行相应的转发操作;如果没有相应的匹配项,那么它就将这个数据包传递给控制器进行处理。3)SDN提供了更丰富的匹配字段,包括入端口号,TCP源/目的端口号,ARP操作码等41个字段,而不局限于传统的MAC地址和IP地址等少量二层/三层字段,从而能够实现更细粒度的网络流量管理与控制。4)在SDN环境下,网络管理员(Network Operator)能够有一个全局的网络管理视图,从而便于资源的统一管理与调度。在传统网络中,复杂分布式算法的交互与通讯使得资源的全局调度与分配变得十分困难。5)OpenFlow的目标是提供一个管理转发硬件的开放的标准接口,这个转发硬件可以是一个路由器或者交换机。这种想法的基础是现代的路由器(或者交换机)都有FIB(forwarding information table),FIB一般使用TCAM(Ternary Content Addressable Memory)构成的。OpenFlow提供一个协议,通过添加、修改、删除Flowtable的表项来对FIB编程。OpenFlow中的FlowTable是对路由器中FIB的一个抽象。在OpenFlow网络中,所有的逻辑都是在叫做OpenFlow控制器的中心系统中执行的,OpenFlow控制器使用OpenFlow协议来管理OpenFlow交换机。但是在SDN大规模部署过程中,尤其是在向运营商级别网络部署的时候,SDN网络的可靠性受到严峻考验,目前还没有高效的机制能够使其达到运营商级别网络的50ms恢复时间的QoS要求。网络的性能主要通过丢包率、延迟、吞吐量和可用性来度量。在发生故障(光纤被挖断、路由器崩溃等)的情况下,网络的性能将会大大降低。根据Gianluca Iannaccone等人收集的数据,链路(接口)故障经常发生,它们会遍布在几天内,甚至一整天内。据推断,10%的故障可能由于光纤被挖断而造成;50%的故障可能由于链路不明原因的短暂故障而造成。另外,链路故障发生频繁,几乎所有链路故障的时间间隔都在100分钟以内,这将严重影响网络的服务质量。由此可见,即使在现代网络中,网络故障还是频繁发生,成为导致网络性能降级的主要因素。一般来讲,运营商网络严格限制故障恢复的时间延迟不能超过50ms。但是,不同的应用程序有不同的故障恢复需求。例如:一些多媒体应用程序(如网络电话、视频会议和在线游戏等)和一些新兴服务(如数据中心中的高性能计算,光纤网络的存储服务和交易算法等)都是延迟敏感的,一点点的端到端延迟将会导致用户体验的极度下降,巨大的经济损失,甚至不可挽回的灾难;但是也有一些服务不是延迟敏感的(如Email等),适度的延
迟对它们来说是可以容忍的。另外,即使网络发生了故障,网络的一些策略(Policy)(如防火墙策略、访问控制等)也必须执行。例如,无论何时,http流量都必须经过一个防火墙(Firewalls);所有的流都必须避免一些可疑的攻击者,即黑名单机制。整体上,目前应对网络故障的方案分为故障保护和故障恢复两种。1)故障保护。故障保护依赖于提前计算的备份路径和预分配的资源来对故障部件进行绕行。在故障保护中,备份路径时提前计算好的,相应的备份流表项也会提前在交换机上面分配好。在正常情况下,数据包沿着正常链路进行转发;当故障发生时,检测到故障的交换机迅速将数据包切换到备份链路进行转发,这种切换进行的十分迅速,从而保证的极短的故障恢复时间。2)故障恢复。故障恢复依赖动态重路由来规避故障部件。在故障恢复中,备份路径可能是提前计算好的,也可能是当网络发生故障时动态计算的,但是相应的备份流表项一定是在发生故障之后才进行分配的。当交换机检测到故障之后,它会向控制器报告相应的故障,根据控制器的响应建立备份路径,实现故障保护。相比于故障保护,故障恢复最大的特点在于动态性,这种动态性赋予了故障恢复更强的灵活性,同时也使得它的恢复延迟较大,较难满足一些程序的故障恢复延迟需求。由此可见,故障保护是服务优先型,通过占有大量的资源来保证对网络故障的快速应对;故障恢复方案是资源优先型,它以牺牲故障恢复的时间来换取更少的资源需求。然而,它们都没有考虑到不同应用的故障恢复需求,没有提供区分服务,从而导致网络资源的低效利用。
技术实现思路
本专利技术的主要目的在于克服现有技术的不足,提供一种网络故障处理方法和处理系统,将故障保护和故障恢复结合起来,能够进行细粒度的网络资源分配,从流的级别保证服务质量,在处理故障的同时保证网络策略的正确执行。为实现上述目的,本专利技术采用以下技术方案:一种网络故障处理方法,所述网络包括交换机和控制器,交换机和控制器之间通过OpenFlow协议标准进行交互,控制器能够获取网络的全局拓扑,采用带外控制方式和交换机进行通讯,交换机负责正常数据包的转发和故障检测,控制器负责备份路径的构建、备份流表项的分配和流表的下发;所述方法包括以下步骤:A、根据网络拓扑和策略需求构建备份路径;其中对于每条流,针对正常转发路径上面的每条链路,备份路径由对应的安全点唯一确定,所述安全点是满足以下条件的点:a.从故障上游节点到安全点之间的路径不经过故障链路;b.从安全点到目的地的正常转发路径不经过故障链路;c.连接上面的两段链路形成的备份路径满足流的服务链本文档来自技高网
...

【技术保护点】
一种网络故障处理方法,其特征在于,所述网络包括交换机和控制器,交换机和控制器之间通过OpenFlow协议标准进行交互,控制器能够获取网络的全局拓扑,采用带外控制方式和交换机进行通讯,交换机负责正常数据包的转发和故障检测,控制器负责备份路径的构建、备份流表项的分配和流表的下发;所述方法包括以下步骤:A、根据网络拓扑和策略需求构建备份路径;其中对于每条流,针对正常转发路径上面的每条链路,备份路径由对应的安全点唯一确定,所述安全点是满足以下条件的点:a.从故障上游节点到安全点之间的路径不经过故障链路;b.从安全点到目的地的正常转发路径不经过故障链路;c.连接上面的两段路径形成的备份路径满足流的服务链需求;B、根据网络中交换机的可用资源(TCAM)情况合理分配备份流表,使得每个流的故障需求都能够得到满足。

【技术特征摘要】
1.一种网络故障处理方法,其特征在于,所述网络包括交换机和控制器,交换机和控制器之间通过OpenFlow协议标准进行交互,控制器能够获取网络的全局拓扑,采用带外控制方式和交换机进行通讯,交换机负责正常数据包的转发和故障检测,控制器负责备份路径的构建、备份流表项的分配和流表的下发;所述方法包括以下步骤:A、根据网络拓扑和策略需求构建备份路径;其中对于每条流,针对正常转发路径上面的每条链路,备份路径由对应的安全点唯一确定,所述安全点是满足以下条件的点:a.从故障上游节点到安全点之间的路径不经过故障链路;b.从安全点到目的地的正常转发路径不经过故障链路;c.连接上面的两段路径形成的备份路径满足流的服务链需求;B、根据网络中交换机的可用资源(TCAM)情况合理分配备份流表,使得每个流的故障需求都能够得到满足。2.如权利要求1所述的网络故障处理方法,其特征在于,所述备份路径包括以下三部分:(1)从流的起点到故障点之间的路径,这部分路径和流的正常转发路径相重叠;(2)从故障点到安全点之间的路径,这部分路径根据遍历算法得到,需要额外的备份流表;(3)从安全点到流终点的路径,这部分路径和正常转发路径重叠;对于网络中的流,其针对某条链路的备份路径满足以下条件:a.备份路径不经过特定的故障链路;b.备份路径上面的服务链和原始服务链相互兼容。3.如权利要求2所述的网络故障处理方法,其特征在于,备份路径满足以下条件:对于任意给定的网络流对于其正常转发路径上面的每一条链路ei,为其构造一条相应的备份路径,使得这条备份路径不经过链路ei,并且路径上面的middlebox所构成的服务链满足原始流的服务链需求。4.如权利要求2或3所述的网络故障处理方法,其特征在于,步骤A中,构建备份路径的算法包括:以广度优先搜索的方式遍历网络拓扑来寻找安全点,从上游检测到故障的节点开始,依次遍历网络中每一个节点并假设该节点为安全点,用该安全点来构建备份路径;然后,用流的故障需求和服务链需求来验证这条备份路径是否合法:如果这条备份路径是合法的,则
\t判断当前的节点就是要找的安全点,保存相应的备份路径;如果这条路径不满足需求,则就退出当前验证过程,遍历下一个节点;优选地,在有多个合法的安全点存在的情况下,选择第一个合法的安全点。5.如权利要求1至4任一项所述的网络故障处理方法,其特征在于,步骤B中,所述合理分配备份流表满足以下条件:对于给定的交换机可利用资源σv,网络流的延迟需求,备分流表的分配方案使得分配给每个交换机的备份流表项数目不超过交换机的可用资源数目,并且保证每个流的延迟需求能够得到满足。6.如权利要求5所述的网络故障处理方法,其特征在于,按照以下规则分配备份流表:(1)TCAM容量越大的交换机放置越多的备份流表项;(2)延迟需求越高的流的备份流表项越被优先放置到相应的交换机中;(3)遍历路径越短的流的备份流表项越被优先放置到相应的交换机中。7.如权利要求6所述的网络故障处理方法,其特征在于,步骤B中,分配备份流表的算法包括:依次将最...

【专利技术属性】
技术研发人员:李清李亨通肖喜江勇
申请(专利权)人:清华大学深圳研究生院
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1