基于混合带内网络遥测的灰色故障检测定位方法及系统技术方案

技术编号:38208869 阅读:12 留言:0更新日期:2023-07-21 16:58
本发明专利技术提出基于混合带内网络遥测的灰色故障检测定位方法及系统,涉及故障检测领域。包括:服务器收集被动INT探测包的逐跳遥测信息,对是否存在故障进行一次检测,向虚拟SDN网络的控制器发送存在故障路径的二次检测指令;控制器向服务器发送主动INT探测包,对一次检测中存在故障的路径进行二次检测;源服务器重新路由真正存在故障的路径信息的数据流量;控制器为所有真正存在故障的路径信息设置优先级,根据优先级进行路径之间的比较,得到故障位置;控制器将故障位置反馈给服务器,服务器查找所有与故障位置相关的路径并提前老化。本发明专利技术将主动带内网络遥测和被动带内网络遥测进行整合,弥补单一遥测方法的不足,提高网络遥测的效率和可靠性。遥测的效率和可靠性。遥测的效率和可靠性。

【技术实现步骤摘要】
基于混合带内网络遥测的灰色故障检测定位方法及系统


[0001]本专利技术属于网络故障检测
,尤其涉及基于混合带内网络遥测的灰色故障检测定位方法及系统。

技术介绍

[0002]本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息,不必然构成在先技术。
[0003]数据中心(DC)是5G、人工智能、云计算等新一代信息通信技术的重要载体。它应用在生产和生活的许多方面,具有很大的研究价值。通过不断的融合和改造,传统数据中心正逐步向超大规模数据中心转型。数据中心网络(DCN)是指专门设计的网络,用于互连数据中心内的大量计算和存储节点。数据中心网络为数据中心承载的多种服务提供支持,如Web服务、传播、高性能计算、数据分析和数据存储等,这就要求数据中心网络具有可扩展性、高效性和可靠性。然而,硬件、软件和人为错误导致的网络故障是不可避免的,需要持续监控和快速故障检测、定位和恢复。
[0004]网络故障通常是指由于硬件问题、软件漏洞、病毒入侵等原因导致网络无法提供正常服务或降低服务质量的状态。一般来说,网络故障可以分为两类。第一类网络故障是显式故障,是由架构网络的设备引起的,主要包括网卡、网线、路由器、交换机、调制解调器等。显式故障通常伴随着明显的表现,如硬件设备损坏、链路异常断开等。通过一些简单的方法,如PING命令和Tracert命令,专业人员可以很容易地在损害扩大之前发现并处理这种故障。显式故障破坏性大,但存在时间短,易于处理,能造成的损害非常有限。
[0005]然而,另一类称为灰色故障的故障更为复杂且危害更大。灰色故障被定义为微分可观察性的一种形式。更准确地说,当至少一个应用程序观察到系统不健康,但观察者观察到系统健康时,系统被定义为正在经历灰色故障。灰色故障一般不易察觉,可能长期存在。此外,人工检测和定位故障点难度大、耗时长,在故障处理期间可能对数据中心网络造成较大危害。因此,为了最大限度地减少灰色故障带来的不利影响,建立快速可靠的灰色故障检测和定位机制非常重要。
[0006]网络测量是实现网络感知和网络管控的关键性技术。全面、系统、高效的网络测量深刻影响了未来网络运行效率。传统的网络测量根据测量方式的不同可以分为主动测量、被动测量和混合测量。主动测量根据具体的测量需要向待测网络主动发送探测包,由于受到网络内部因素的影响,探测包会发生一系列的特性变化,通过对这些变化做出分析进而得到网络的状态信息和性能参数。被动测量在网络中的关键设备和节点处对数据包进行获取、记录和分析,从而得到网络状态和性能参数。相较于主动测量,由于被动测量没有向网络注入额外的探测数据包,所以对网络产生的影响较小,测量结果也更为精准。但是由于测量只在关键设备和节点处部署,被动测量只能获取网络局部的状态信息,无法感知网络全局。除此之外,实际应用效果还受到网络设备性能和网络带宽的限制,这可能会造成一定程度的测量精度损失。
[0007]混合测量通过将主动测量和被动测量进行科学整合,合理的灵活利用二者的优点进行更加高效、准确的网络测量。传统的网络测量方法由于部署简单,在网络管理领域得到了广泛的应用。但随着网络规模日益扩大,流量激增,传统网络测量技术呈现出测量算法精度低、测量语言通用性差和测量任务配置智能化程度低等多种问题,无法适应未来网络的要求。软件定义网络的出现和发展,使得对网络进行细粒度的网络测量和精细化的网络管理成为可能。作为一种新兴网络架构,SDN将控制功能和转发功能解耦,通过控制器对网络行为进行高效的统一管理,将网络底层逻辑透明化,简化网络测量逻辑复杂性,同时由交换机完成对网络测量数据的采集工作,从而实现高效可靠的测量。然而额外部署测量机制可能会占用网络中有限的资源,而且中心化的控制平面也存在着的性能瓶颈。
[0008]与传统的测量解决方案和软件定义的网络测量解决方案相比,网络遥测被认为是一种理想且有效的测量替代方案,它提供了更好的准确性、可扩展性和性能。带内网络遥测技术作为网络遥测的一个典型应用,受到学术界和工业界的广泛关注。带内网络遥测(INT)是由可编程数据平面(PDP)驱动的新兴网络遥测框架。INT将报文转发与网络测量相结合。数据包将包含遥测指令,这些指令将由可编程网络元件处理和执行。因此,网络元件不仅转发数据包,还参与网络测量任务。当携带遥测指令的数据包通过设备时,遥测指令向INT设备指示收集什么网络信息并将其插入数据包中。因此,INT是一种获取网络状态信息的有效方式,可以为网络运营、管理和维护(OAM)提供准确的实时数据。
[0009]专利技术人发现,目前,INT可分为主动和被动两大类。主动带内网络遥测通过构造INT探测数据包来承载逐跳遥测数据。因此,它的重点是设计高效的路径规划算法。被动带内网络遥测依赖业务流来携带逐跳遥测信息。因此,它的重点通常是设计高效的任务编排算法。主动带内网络遥测具有探测路径构建灵活但带宽开销大的特点。被动带内网络遥测具有带宽开销小的特点,但受业务流量潮汐分布的影响。
[0010]由于INT具有灵活的可编程性、实时监控、高信噪比和逐流网络感知等特点,使得它非常适合用于故障检测等工作中。然而,只有极少数的研究工作探讨了带内网络遥测在灰色故障检测定位方面的应用,由于大多采用的都是主动带内网络遥测的方法,这导致大量带宽资源被占用,而且都存在系统复杂、资源消耗大和检测不够及时等问题。

技术实现思路

[0011]为克服上述现有技术的不足,本专利技术提供了基于混合带内网络遥测的灰色故障检测定位方法及系统,将主动带内网络遥测和被动带内网络遥测进行有效整合并应用到灰色故障的检测和定位中,设计了一个高效、完整的基于混合带内网络遥测的灰色故障检测和定位方法,弥补单一遥测方法的不足,进一步提高网络遥测的效率和可靠性,能够快速检测设备和链路故障并做出响应。
[0012]为实现上述目的,本专利技术的一个或多个实施例提供了如下技术方案:
[0013]本专利技术第一方面提供了基于混合带内网络遥测的灰色故障检测定位方法。
[0014]基于混合带内网络遥测的灰色故障检测定位方法,包括以下步骤:
[0015]步骤一:服务器收集被动INT探测包携带的逐跳遥测信息,获取源和目标之间所有可行的路径信息,对路径信息中是否存在故障进行一次检测,若检测结果为存在故障,则向虚拟SDN网络的控制器发送存在故障路径的二次检测指令;
[0016]步骤二:控制器接收二次检测指令,向服务器发送主动INT探测包,服务器转发主动INT探测包,对一次检测中存在故障的路径进行二次检测,确认是否真正存在故障,并将真正存在故障的路径信息发送至控制器;
[0017]步骤三:控制器向真正存在故障的路径信息的源服务器发送真正存在故障的路径信息,由源服务器重新路由真正存在故障的路径信息的数据流量;
[0018]步骤四:分布式服务器中的所有服务器均执行上述步骤一至步骤三,将网络中所有真正存在故障的路径信息均上传到控制器;
[0019]步骤五:控制器为所有真正存在故障的路径信息设置优先级,根据优先级进行路径本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于混合带内网络遥测的灰色故障检测定位方法,其特征在于,包括以下步骤:步骤一:服务器收集被动INT探测包携带的逐跳遥测信息,获取源和目标之间所有可行的路径信息,对路径信息中是否存在故障进行一次检测,若检测结果为存在故障,则向虚拟SDN网络的控制器发送存在故障路径的二次检测指令;步骤二:控制器接收二次检测指令,向服务器发送主动INT探测包,服务器转发主动INT探测包,对一次检测中存在故障的路径进行二次检测,确认是否真正存在故障,并将真正存在故障的路径信息发送至控制器;步骤三:控制器向真正存在故障的路径信息的源服务器发送真正存在故障的路径信息,由源服务器重新路由真正存在故障的路径信息的数据流量;步骤四:分布式服务器中的所有服务器均执行上述步骤一至步骤三,将网络中所有真正存在故障的路径信息均上传到控制器;步骤五:控制器为所有真正存在故障的路径信息设置优先级,根据优先级进行路径之间的比较,得到故障位置;步骤六:控制器将故障位置反馈给服务器,服务器查找所有与故障位置相关的路径并提前老化。2.如权利要求1所述的基于混合带内网络遥测的灰色故障检测定位方法,其特征在于,服务器收集被动INT探测包携带的逐跳遥测信息,获取源和目标之间所有可行的路径信息,对路径信息中是否存在故障进行一次检测,具体为:在服务器上设置一个本地路径信息表,路径信息表中记录每个路径条目的老化时间和二次检测时间;服务器接收到遥测信息后,将从遥测信息中提取的路径信息添加到本地路径信息表中,或者更新具有相同路径的路径表项的老化时间;当一条路径条目的老化时间为0时,从这条路径条目从路径信息表中删除;当路径信息表中路径条目的二次检测时间为0时,判断出现故障。3.如权利要求1所述的基于混合带内网络遥测的灰色故障检测定位方法,其特征在于,所述遥测信息包括被动INT探测包和主动INT探测包所经过的交换机的标识、进入交换机的入口端口ID和离开交换机的出口端口ID。4.如权利要求2所述的基于混合带内网络遥测的灰色故障检测定位方法,其特征在于,老化时间和二次检测时间应遵循以下约束:agetime≥stdtime+prtime.其中,prtime是指在二次检测过程中,INT包从发送方传输到接收方所需的时间;agetime为老化时间;stdtime为二次检测时间。5.如权利要求1所述的基于混合带内网络遥测的灰色故障检测定位方法,其特征在于,服务器转发主动INT探测包,对一次检测中存在故障的路径进行二次检测,确认是否真正存在故障,具体为:设定源A在路径P上发送一个主动INT探测包至目的B,对路径P进行二次检测,则:如果目的B在老化时间为0之前收到源A发送的主动INT探测包,目的B会更新路径条目P的老化时间,表示路径P没有故障;如果目标B在P的老化时间为0之前没有收到源A发送的主动INT探测包,表示路径P确实
存在故障。6.如权利要求2所述的基于混合带内网络遥测的灰色故障检测定位方法,其特征在于,控制器为所有真正存在故障的路径信息设置优先级,根据优先级进行路径之间的比较,得到故障位置,具体为:步骤一:控制器从每条路径表项中获取源和目的在数据中心网络中的位置,并为源和目的分别设置优先级属性,分别定义为Source(Pod,Tor,Server,Priority)和Destination(Pod,Tor,Server,Priority);步骤二:当控制器接收到第一个故障路径信息No.1时,以No.1为基准,分别将No.1的源/目的位置与No.i的源/目的位置进行比较;步骤三:根据优先级设置规则,为No.i设置相应的优先级;步骤四:根据优先级进行路径条目之间的比较,优...

【专利技术属性】
技术研发人员:张玮张奎超史慧玲谭立状丁伟郝昊张磊
申请(专利权)人:齐鲁工业大学山东省科学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1