基于云平台的网络运维方法、系统和计算设备集群技术方案

技术编号:37985295 阅读:8 留言:0更新日期:2023-06-30 10:00
本申请公开了一种基于云平台的网络运维方法、系统和计算设备集群,属于网络运维技术领域。本申请提供的技术方案中,由云平台向客户端下发运维标签,通过将运维标签携带在数据流中传输,指示沿路网络设备上报目标传输指标的指标数据,从而由云平台获取整网的指标数据,从而能够高效地进行运维分析。因此,能够从端到端业务数据流的角度进行整网运维,解决网络跨域情况下,整网需分段运维、拼接才能定界故障的问题,有效提升排查网络故障的效率,提供业务随行的网络运维能力。供业务随行的网络运维能力。供业务随行的网络运维能力。

【技术实现步骤摘要】
基于云平台的网络运维方法、系统和计算设备集群


[0001]本申请涉及网络运维
,特别涉及一种基于云平台的网络运维方法、系统和计算设备集群。

技术介绍

[0002]随着通信技术的发展,通信网络的架构也越来越庞大和复杂,业务数据通常需要跨多个区域(region)、跨多种云进行传输。以企业分支站点访问总部业务系统的场景为例,企业分支站点首先通过专线接入本地城域网,再通过云骨干网跨网段连接到总部所在区域,最后通过云内网络,进入基于虚拟私有云(virtual private cloud,VPC)运行的总部业务系统。
[0003]目前,针对上述这类跨多云、跨多网的业务流进行运维的难度较大。相关技术中,每段网络通常独立运维,当业务流不通时,需要运维人员分别到每段网络上单独进行运维分析,再进行多段网络拼接,才能确定网络故障的发生情况,而由于每段网络均独立建设,采用的厂商设备、转发技术各不相同,导致各段网络所涉及的运维技术方案和工具均不同,从而造成网络故障的排查效率很低。
[0004]因此,亟需一种网络运维方法,在多云多网的业务场景下,能够有效提升对网络故障进行排查的效率。

技术实现思路

[0005]本申请提供了一种基于云平台的网络运维方法、系统和计算设备集群,能够有效提升排查网络故障的效率,提供业务随行的网络运维能力。该技术方案如下:
[0006]第一方面,提供了一种基于云平台的网络运维方法,由云平台执行,方法包括:
[0007]云平台向客户端发送运维标签,运维标签用于携带在客户端发送的数据流中,以指示传输数据流的网络设备上报目标传输指标的指标数据;
[0008]云平台接收网络设备基于运维标签上报的指标数据;
[0009]云平台基于接收到的指标数据进行运维分析。
[0010]通过上述技术方案,由云平台向客户端下发运维标签,通过将运维标签携带在数据流中传输,指示沿路网络设备上报指标数据,来高效地进行运维分析。因此,能够从端到端业务数据流的角度进行整网运维,解决网络跨域情况下,整网需分段运维、拼接才能定界故障的问题,有效提升排查网络故障的效率,提供业务随行的网络运维能力。
[0011]在一种可能实施方式中,方法还包括:
[0012]云平台接收客户端的故障分析请求,故障分析请求携带故障类型;
[0013]云平台基于故障类型,生成运维标签,运维标签所指示的目标传输指标与故障类型对应。
[0014]在一种可能实施方式中,传输指标包括:丢包率、时延和抖动中至少一项。
[0015]通过上述过程,能够针对多类网络故障,提供丰富的、可灵活组合、按需配置的运
维标签下发逻辑,提升运维标签对业务的针对性,进一步提升运维效率。
[0016]在一种可能实施方式中,云平台基于接收到的指标数据进行运维分析,包括:
[0017]对比从多个网络设备接收到的指标数据,确定发生网络故障的目标网络设备。
[0018]通过上述技术方案,可以提供单点设备级的排查精度。
[0019]在一种可能实施方式中,运维标签还包括数据流的数据流标识,运维标签还用于指示网络设备上报网络设备的标识。
[0020]设备的标识可以精确地标识指标数据的来源设备,数据流标识能够指定运维针对的数据流,从而针对业务侧指定的数据流实现单点设备级的故障点定位。
[0021]在一种可能实施方式中,运维标签位于数据流的网络协议IP头中的目标字段。
[0022]通过上述技术方案,保证指标数据的收集随着真实的业务数据流传输而进行,真正从业务视角来检测网络故障,有效提升网络运维的效率以及和实际业务的贴合度。
[0023]第二方面,提供了一种基于云平台的网络运维方法,由客户端执行,方法包括:
[0024]接收云平台提供的运维标签,运维标签指示网络设备上报目标传输指标的指标数据;
[0025]将运维标签携带在数据流中发送。
[0026]在一种可能实施方式中,将运维标签携带在数据流中发送,包括:
[0027]将运维标签携带在数据流的网络协议IP头中的目标字段发送。
[0028]通过上述技术方案,客户端高效地将云平台下发的运维标签携带在数据流中,从而保证指标数据的收集随着真实的业务数据流传输而进行,真正从业务视角来检测网络故障,有效提升网络运维的效率以及和实际业务的贴合度。
[0029]第三方面,提供了一种基于云平台的网络运维方法,由网络设备执行,方法包括:
[0030]网络设备接收数据流,数据流携带运维标签,运维标签指示网络设备上报目标传输指标的指标数据;
[0031]基于运维标签,获取指标数据,向云平台上报指标数据。
[0032]在一种可能实施方式中,基于运维标签,获取指标数据,包括:
[0033]从数据流的IP头中检测到运维标签,基于检测到的运维标签所指示的目标指标类型,获取指标数据。
[0034]在一种可能实施方式中,网络设备为第一网络的入设备,方法还包括:
[0035]将数据流中运维标签复制到第一网络的封装协议的外层报文头中。
[0036]其中,第一网络可以是数据流所经过的任一段网络。在一些实施例中,数据流所流经的每一段网络的入设备,都会将内层报文的运维标签复制到该段网络的外层隧道封装头中,例如,数据的第一段接入网中的入设备(用户边界设备)以及后续的云区域网络的入设备、云骨干网的入设备等,都会执行上述复制运维标签的步骤。通过上述技术方案,能够保持运维标签始终位于外层报文结构中,使得整网的网络设备可以在同一数据面上检测到运维标签,处于不同层次、不同类型的网络中的网络设备均能够向云平台上报指标数据,实现整网端到端的运维标签在数据面始终一致,以简洁的逻辑即保障了本申请的方法在各种跨云跨网架构中的灵活适用性。
[0037]在一种可能实施方式中,向云平台上报指标数据,包括:
[0038]向网络设备对应的网络服务平台发送指标数据,由网络服务平台向云平台发送指
标数据的分析结果。
[0039]通过上述过程,保证了网络中指标数据的安全性,在无需直接暴露真实数据的情况下,云平台依旧可以获取有效的运维分析结果,从而保证整网运维的效率。
[0040]第四方面,提供了一种基于云平台的网络运维方法,由网络服务平台执行,方法包括:从传输数据流的网络设备,获取目标传输指标的指标数据;
[0041]基于指标数据进行运维分析,向云平台发送指标数据的分析结果。
[0042]其中,该网络服务平台可以为非云平台自建的第三方网络平台,例如,运营商的云平台。通过上述技术方案,针对云平台不直接获取指标数据的场景,有效地提供了进一步解决方案,在保证数据安全性的基础上,有效提升多云、多网场景下的整网运维效率。由于运营商网络涉及的指标数据和设备标识等运维相关的信息,通常不直接向用户反馈;并且,对业务侧用户而言,运营商网络中各种数据的可解释性较差,因此,运营本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于云平台的网络运维方法,其特征在于,由云平台执行,所述方法包括:所述云平台向客户端发送运维标签,所述运维标签用于携带在所述客户端发送的数据流中,以指示传输所述数据流的网络设备上报目标传输指标的指标数据;所述云平台接收所述网络设备基于所述运维标签上报的指标数据;所述云平台基于接收到的所述指标数据进行运维分析。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:所述云平台接收所述客户端的故障分析请求,所述故障分析请求携带故障类型;所述云平台基于所述故障类型,生成所述运维标签,所述运维标签所指示的目标传输指标与所述故障类型对应。3.根据权利要求1或2所述的方法,其特征在于,所述云平台基于接收到的所述指标数据进行运维分析,包括:对比从多个所述网络设备接收到的指标数据,确定发生网络故障的目标网络设备。4.根据权利要求1至3任一项所述的方法,其特征在于,所述运维标签还包括所述数据流的数据流标识,所述运维标签还用于指示网络设备上报所述网络设备的标识。5.根据权利要求1至4任一项所述的方法,其特征在于,所述传输指标包括:丢包率、时延和抖动中至少一项。6.根据权利要求1至5任一项所述的方法,其特征在于,所述运维标签位于所述数据流的网络协议IP头中的目标字段。7.一种基于云平台的网络运维方法,其特征在于,由客户端执行,所述方法包括:接收云平台提供的运维标签,所述运维标签指示网络设备上报目标传输指标的指标数据;将所述运维标签携带在数据流中发送。8.根据权利要求7所述的方法,其特征在于,所述将所述运维标签携带在数据流中发送,包括:将所述运维标签携带在所述数据流的网络协议IP头中的目标字段发送。9.一种基于云平台的网络运维方法,其特征在于,由网络设备执行,所述方法包括:所述网络设备接收数据流,所述数据流携带运维标签,所述运维标签指示网络设备上报目标传输指标的指标数据;基于所述运维标签,获取所述指标数据,向云平台上报所述指标数据。10.根据权利要求9所述的方法,其特征在于,所述向云平台上报所述指标数据,包括:向所述网络设备对应的网络服务平台发送所述指标数据,由所述网络服务平台向所述云平台发送所述指标数据的分析结果。11.根据权利要求9或10所述的方法,其特征在于,所述基于所述运维标签,获取所述指标数据,包括:从所述数据流的IP头中检测到所述运维标签,基于检测到的所述运维标签所指示的目标指标类型,获取所述指标数据。12.根据权利要求9至11任一项所述的方法,其特征在于,所述网络设备为第一网络的入设备,所述方法还包括:将所述数据流中所述运维标签复制到所述第一网络的封装协议的外层报文头中。
13.一种基于云平台的网络运维方法,其特征在于,由网络服务平台执行,所述方法包括:从传输数据流的网络设备,获取目标传输指标的指标数据;基于所述指标数据进行运维分析,向云平台发送所述指标...

【专利技术属性】
技术研发人员:周宇彭书萍陈晓峰丰春霞
申请(专利权)人:深圳华为云计算技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1