一种云数据中心网络网内端到端路由异常分析方法技术

技术编号:35808102 阅读:17 留言:0更新日期:2022-12-03 13:26
本发明专利技术公开了一种云数据中心网络网内端到端路由异常分析方法,包括:步骤1)网络拓扑数据采集步骤;步骤2)基于采集的网络拓扑数据,建立路由基线模型步骤;步骤3)路由数据采集步骤;步骤4)路由数据分析步骤。本发明专利技术采取了上述方案后,对任意两台虚拟机之间的数据包转发过程所涉及的路由/转发表项进行自动化采集监控,并自动判断是否出现异常,及时发现、定位由于路由问题导致的虚拟机之间的通信故障,能够有效提升网络运维效率及网络/业务的稳定性。性。性。

【技术实现步骤摘要】
一种云数据中心网络网内端到端路由异常分析方法


[0001]本专利技术属于通信领域,属于一种云数据中心网络网内端到端路由异常分析方法。

技术介绍

[0002]目前云数据中心网络环境广泛部署在各类关键IT系统及电信运营商网络系统中,支撑各类应用系统、业务系统的灵活、弹性部署。在云数据中心网络环境中,虚拟机/容器的迁移、部署、删除操作频繁,为了保证虚拟机/容器之间的互通,网络路由需要同步变更,因此与传统网络相比,这种频繁的变更,更容易引发路由类故障,同时由于云数据中心网络环境部署的路由技术种类复杂,既涉及到虚拟网络,又涉及到物理网络,因此路由故障的排查过程极为困难,经常严重影响上层应用的稳定运行。
[0003]如图2所示,基于host overlay的云数据中心网络,是一种典型的云数据中心网络结构。
[0004]其中,上述基于host overlay的云数据中心网络环境包括使用linux操作系统的物理服务器和采用spine

leaf架构的物理网络。
[0005]物理服务器中的虚拟网络组件包括包括Linux内核网桥qbrxx、OVS网桥BR

INT、OVS网桥BR

TUN、linux虚拟接口veth、OVS网桥虚拟接口patch、运行在物理服务器中虚拟机的虚拟网络接口tap。
[0006]物理网络包括spine交换机与leaf交换机。
[0007]应用系统在虚拟机(VM)内部运行,并使用虚拟机的网络协议栈实现虚拟机之间基于TCP/IP协议的通信。
[0008]当部署在两台不同的物理服务器中的虚拟机之间进行通信时,以图2中的虚拟机VM1a与虚拟机VM1b为例,数据报文路由转发过程需要依次经过经过下列虚拟或物理网络组件:虚拟机VM1a的网络协议栈、linux内核网桥qbr01a、OVS网桥br

int

a、OVS网桥br

tun

a、以太网接口eth0

a、以太网交换机leaf1、spine1或spine2、leaf2、以太网接口eth0

b、OVS网桥br

tun

b、OVS网桥br

iht

b、linux内核网桥qbr01b、到达虚拟机VM1b的网络协议栈。同时在这个过程涉及ARP、vxlan封装/解封装、以及各种虚拟/物理网络组件的路由转发表查询。
[0009]在一个数据中心网络中,通常包括2台或4台spine交换机、数百台leaf交换机,数千台物理服务器、数万个虚拟机。任何一个虚拟网络组件的路由/转发表项出现错误,均会导致数据包转发错误,造成虚拟机之间的通信异常并影响虚拟机承载的应用系统。

技术实现思路

[0010]本专利技术所要解决的技术问题是提出一种在host overlay云数据中心网络环境中,网内端到端路由异常分析方法,使用该方法,可以实现网内端到端路由的自动监控及自动故障定位。
[0011]本专利技术解决上述技术问题所采取的技术方案如下:
[0012]一种云数据中心网络网内端到端路由异常分析方法包括:
[0013]步骤1)网络拓扑数据采集步骤,包括:物理服务器拓扑数据采集与物理交换机(spine/leaf)拓扑数据采集,用于采集全网所有物理、逻辑网络组件的基本信息及邻居关系信息;
[0014]步骤2)基于采集的网络拓扑数据,建立路由基线模型步骤,具体包括:
[0015]建立全网所有虚拟和/或物理网络组件端到端拓扑,并关联关键组件的IP地址、MAC地址,用于在分析路由数据时,作为判断路由数据是否存在异常的根据;
[0016]步骤3)路由数据采集步骤,包括:
[0017]采集用于控制网内虚拟机之间数据包转发的路由和/或转发表数据,包括虚拟机和/或物理服务器ARP缓存数据、内核网桥转发表、OVS网桥流表、OVS网桥转发表、交换机转发表;
[0018]步骤4)路由数据分析步骤,包括:基于上述路由基线模型,对上述路由和/或转发表数据进行分析,判断是否与路由基线模型一致,并据此判断是否异常。
[0019]优选的是,步骤1)网络拓扑数据采集步骤中,
[0020]物理服务器数据采集使用代理程序实现;
[0021]当网络中存在其他网络管理平台时,则通过与其他网络管理平台提供的接口实现对物理服务器的数据采集;
[0022]物理交换机的数据采集使用SNMP协议;
[0023]当网络中存在其他网络管理平台时,则通过与其他网络管理平台提供的接口实现对物理服务器的数据采集。
[0024]优选的是,物理服务器采集的拓扑数据包括下列内容:
[0025](1a)物理服务器中开通的每一个虚拟机(VM)的唯一标示UUID;
[0026](1b)物理服务器中开通的每一个虚拟机(VM)的IP地址;
[0027](1c)物理服务器中开通的每一个虚拟机(VM)的MAC地址;
[0028](1d)物理服务器的主机名、网卡名称、IP地址、MAC地址;
[0029](1e)物理服务器中配置的所有linux内核网桥名称及连接的接口;
[0030](1f)物理服务器中配置的所有linux内核网桥的转发表,转发表项字段包括MAC地址及其指向的虚拟/物理接口;
[0031](1g)物理服务器中配置的所有OVS网桥的名称及连接的接口;
[0032](1h)物理服务器中所有veth接口配对关系;
[0033](1j)OVS网桥patch接口配对关系;
[0034](1k)VXLAN VTEP IP地址及对应的MAC地址。
[0035]优选的是,物理交换机采集的拓扑数据包括下列内容:
[0036](1m)spine/leaf交换机的名称、管理IP地址;
[0037](1n)spine/leaf交换机的名称/MAC地址、各接口名称/MAC地址;
[0038](1p)leaf交换机转发表;
[0039](1q)spine交换机lldp信息;
[0040](1r)leaf交换机1ldp信息。
[0041]优选的是,步骤2)基于采集的网络拓扑数据,建立路由基线模型步骤,具体包括:
[0042]建立全网所有虚拟/物理网络组件端到端拓扑,包括:
[0043]物理服务器中虚拟机及虚拟网络组件之间的连接关系的虚拟拓扑,
[0044]与物理服务器、交换机之间的物理服务器与物理交换机之间的连接关系、物理交换机之间的连接关系的物理拓扑,并关联关键组件的IP地址、MAC地址;
[0045]在完整的全网虚拟/物理拓扑基础上,得到全网任意两台虚拟机之间的路由基线,包括:
[0046]任意两个虚拟机之间通信需要经过的所有虚拟、物理网络组件及本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种云数据中心网络网内端到端路由异常分析方法,其特征在于,包括:步骤1)网络拓扑数据采集步骤,包括:物理服务器拓扑数据采集与物理交换机(spine/leaf)拓扑数据采集,用于采集全网所有物理、逻辑网络组件的基本信息及邻居关系信息;步骤2)基于采集的网络拓扑数据,建立路由基线模型步骤,具体包括:建立全网所有虚拟和/或物理网络组件端到端拓扑,并关联关键组件的IP地址、MAC地址,用于在分析路由数据时,作为判断路由数据是否存在异常的根据;步骤3)路由数据采集步骤,包括:采集用于控制网内虚拟机之间数据包转发的路由和/或转发表数据,包括虚拟机和/或物理服务器ARP缓存数据、内核网桥转发表、OVS网桥流表、OVS网桥转发表、交换机转发表;步骤4)路由数据分析步骤,包括:基于上述路由基线模型,对上述路由和/或转发表数据进行分析,判断是否与路由基线模型一致,并据此判断是否异常。2.根据权利要求1所述的网内端到端路由异常分析方法,其特征在于,步骤1)网络拓扑数据采集步骤中,物理服务器数据采集使用代理程序实现;当网络中存在其他网络管理平台时,则通过与其他网络管理平台提供的接口实现对物理服务器的数据采集;物理交换机的数据采集使用SNMP协议;当网络中存在其他网络管理平台时,则通过与其他网络管理平台提供的接口实现对物理服务器的数据采集。3.根据权利要求1或2所述的网内端到端路由异常分析方法,其特征在于,物理服务器采集的拓扑数据包括下列内容:(1a)物理服务器中开通的每一个虚拟机(VM)的唯一标示UUID;(1b)物理服务器中开通的每一个虚拟机(VM)的IP地址;(1c)物理服务器中开通的每一个虚拟机(VM)的MAC地址;(1d)物理服务器的主机名、网卡名称、IP地址、MAC地址;(1e)物理服务器中配置的所有linux内核网桥名称及连接的接口;(1f)物理服务器中配置的所有linux内核网桥的转发表,转发表项字段包括MAC地址及其指向的虚拟/物理接口;(1g)物理服务器中配置的所有OVS网桥的名称及连接的接口;(1h)物理服务器中所有veth接口配对关系;(1j)OVS网桥patch接口配对关系;(1k)VXLAN VTEP IP地址及对应的MAC地址。4.根据权利要求1或2所述的网内端到端路由异常分析方法,其特征在于,物理交换机采集的拓扑数据包括下列内容:(1m)spine/leaf交换机的名称、管理IP地址;(1n)spine/leaf交换机的名称/MAC地址、各接口名称/MAC地址;(1p)leaf交换机转发表;(1q)spine交换机lldp信息;(1r)leaf交换机lldp信息。
5.根据权利要求4所述的网内端到端路由异常分析方法,其特征在于,步骤2)基于采集的网络拓扑数据,建立路由基线模型步骤,具体包括:建立全网所有虚拟/物理网络组件端到端拓扑,包括:物理服务器中虚拟机及虚拟网络组件之间的连接关系的虚拟拓扑,与物理服务器、交换机之间的物理服务器与物理交换机之间的连接关系、物理交换机之间的连接关系的物理拓扑,并关联关键组件的IP地址、MAC地址;在完整的全网虚拟/物理拓扑基础上,得到全网任意两台虚拟机之间的路由基线,包括:任意两个虚拟机之间通信需要经过的所有虚拟、物理网络组件及这些组件在路径中的顺序、虚拟与物理网络组件的关键路由参数。6.根据权利要求5所述的网内端到端路由异常分析方法,其特征在于,步骤3)路由数据采集步骤,包括:采集用于控制网内虚拟机之间数据包转发的路由/转发表数据。包括虚拟机/物理服务器ARP缓存数据、内核网桥转发表、OVS网桥流表、OVS网桥转发表、交换机转发表,具体如下:(2a)物理服务器中开通的每一个虚拟机的arp缓存;(2b)物理服务器的arp缓存;(2c)物理服务器路由表;(2d)OVS网桥br

int流表/转发表;(2e)OVS网桥br

tun流表;(2f)OVS网桥br

tunvxlan接口对端VTEP IP;(2e)spine交换机转发表。7.根据权利要求6所述的网内端到端路由异常分析方法,其特征在于,步骤4)中,具体包括:步骤4)路由数据分析步骤,包括:基于上述路由基线,对采集的与控制路由转发有关的数据进行分析;通过与路由基线进行比对,判断任意两台虚拟机之间的路由是否正常,并在不正常的情况下找出所有出现异常的表项。8.根据权利要求7所述的网内端到端路由异常分析方法,其特征在于,路由分析的具体方法如下:1)确定分析路径步骤,包括:根据路由基线,获取虚拟机VM1a至VM1b方向的转发路径中所有的网络组件,其中虚拟机的ARP缓存、物理服务器路由表、ARP缓存及路径中的linux网桥qrb01a(物理服务器A)/qbr01b(物理服务器B)、OVS网桥br

int

a(物理服务器A)/br

int

b(物理服务器B)/br

tun

a(物理服务器A)/br

tun

b(物理服务器B)、物...

【专利技术属性】
技术研发人员:武迎春黎宇张仕勇李宜明徐海
申请(专利权)人:北京润通丰华科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1