【技术实现步骤摘要】
一种云数据中心网络网内端到端路由异常分析方法
[0001]本专利技术属于通信领域,属于一种云数据中心网络网内端到端路由异常分析方法。
技术介绍
[0002]目前云数据中心网络环境广泛部署在各类关键IT系统及电信运营商网络系统中,支撑各类应用系统、业务系统的灵活、弹性部署。在云数据中心网络环境中,虚拟机/容器的迁移、部署、删除操作频繁,为了保证虚拟机/容器之间的互通,网络路由需要同步变更,因此与传统网络相比,这种频繁的变更,更容易引发路由类故障,同时由于云数据中心网络环境部署的路由技术种类复杂,既涉及到虚拟网络,又涉及到物理网络,因此路由故障的排查过程极为困难,经常严重影响上层应用的稳定运行。
[0003]如图2所示,基于host overlay的云数据中心网络,是一种典型的云数据中心网络结构。
[0004]其中,上述基于host overlay的云数据中心网络环境包括使用linux操作系统的物理服务器和采用spine
‑
leaf架构的物理网络。
[0005]物理服务器中的虚拟网络组件包括包括Linux内核网桥qbrxx、OVS网桥BR
‑
INT、OVS网桥BR
‑
TUN、linux虚拟接口veth、OVS网桥虚拟接口patch、运行在物理服务器中虚拟机的虚拟网络接口tap。
[0006]物理网络包括spine交换机与leaf交换机。
[0007]应用系统在虚拟机(VM)内部运行,并使用虚拟机的网络协议栈实现虚拟机之间基于TC ...
【技术保护点】
【技术特征摘要】
1.一种云数据中心网络网内端到端路由异常分析方法,其特征在于,包括:步骤1)网络拓扑数据采集步骤,包括:物理服务器拓扑数据采集与物理交换机(spine/leaf)拓扑数据采集,用于采集全网所有物理、逻辑网络组件的基本信息及邻居关系信息;步骤2)基于采集的网络拓扑数据,建立路由基线模型步骤,具体包括:建立全网所有虚拟和/或物理网络组件端到端拓扑,并关联关键组件的IP地址、MAC地址,用于在分析路由数据时,作为判断路由数据是否存在异常的根据;步骤3)路由数据采集步骤,包括:采集用于控制网内虚拟机之间数据包转发的路由和/或转发表数据,包括虚拟机和/或物理服务器ARP缓存数据、内核网桥转发表、OVS网桥流表、OVS网桥转发表、交换机转发表;步骤4)路由数据分析步骤,包括:基于上述路由基线模型,对上述路由和/或转发表数据进行分析,判断是否与路由基线模型一致,并据此判断是否异常。2.根据权利要求1所述的网内端到端路由异常分析方法,其特征在于,步骤1)网络拓扑数据采集步骤中,物理服务器数据采集使用代理程序实现;当网络中存在其他网络管理平台时,则通过与其他网络管理平台提供的接口实现对物理服务器的数据采集;物理交换机的数据采集使用SNMP协议;当网络中存在其他网络管理平台时,则通过与其他网络管理平台提供的接口实现对物理服务器的数据采集。3.根据权利要求1或2所述的网内端到端路由异常分析方法,其特征在于,物理服务器采集的拓扑数据包括下列内容:(1a)物理服务器中开通的每一个虚拟机(VM)的唯一标示UUID;(1b)物理服务器中开通的每一个虚拟机(VM)的IP地址;(1c)物理服务器中开通的每一个虚拟机(VM)的MAC地址;(1d)物理服务器的主机名、网卡名称、IP地址、MAC地址;(1e)物理服务器中配置的所有linux内核网桥名称及连接的接口;(1f)物理服务器中配置的所有linux内核网桥的转发表,转发表项字段包括MAC地址及其指向的虚拟/物理接口;(1g)物理服务器中配置的所有OVS网桥的名称及连接的接口;(1h)物理服务器中所有veth接口配对关系;(1j)OVS网桥patch接口配对关系;(1k)VXLAN VTEP IP地址及对应的MAC地址。4.根据权利要求1或2所述的网内端到端路由异常分析方法,其特征在于,物理交换机采集的拓扑数据包括下列内容:(1m)spine/leaf交换机的名称、管理IP地址;(1n)spine/leaf交换机的名称/MAC地址、各接口名称/MAC地址;(1p)leaf交换机转发表;(1q)spine交换机lldp信息;(1r)leaf交换机lldp信息。
5.根据权利要求4所述的网内端到端路由异常分析方法,其特征在于,步骤2)基于采集的网络拓扑数据,建立路由基线模型步骤,具体包括:建立全网所有虚拟/物理网络组件端到端拓扑,包括:物理服务器中虚拟机及虚拟网络组件之间的连接关系的虚拟拓扑,与物理服务器、交换机之间的物理服务器与物理交换机之间的连接关系、物理交换机之间的连接关系的物理拓扑,并关联关键组件的IP地址、MAC地址;在完整的全网虚拟/物理拓扑基础上,得到全网任意两台虚拟机之间的路由基线,包括:任意两个虚拟机之间通信需要经过的所有虚拟、物理网络组件及这些组件在路径中的顺序、虚拟与物理网络组件的关键路由参数。6.根据权利要求5所述的网内端到端路由异常分析方法,其特征在于,步骤3)路由数据采集步骤,包括:采集用于控制网内虚拟机之间数据包转发的路由/转发表数据。包括虚拟机/物理服务器ARP缓存数据、内核网桥转发表、OVS网桥流表、OVS网桥转发表、交换机转发表,具体如下:(2a)物理服务器中开通的每一个虚拟机的arp缓存;(2b)物理服务器的arp缓存;(2c)物理服务器路由表;(2d)OVS网桥br
‑
int流表/转发表;(2e)OVS网桥br
‑
tun流表;(2f)OVS网桥br
‑
tunvxlan接口对端VTEP IP;(2e)spine交换机转发表。7.根据权利要求6所述的网内端到端路由异常分析方法,其特征在于,步骤4)中,具体包括:步骤4)路由数据分析步骤,包括:基于上述路由基线,对采集的与控制路由转发有关的数据进行分析;通过与路由基线进行比对,判断任意两台虚拟机之间的路由是否正常,并在不正常的情况下找出所有出现异常的表项。8.根据权利要求7所述的网内端到端路由异常分析方法,其特征在于,路由分析的具体方法如下:1)确定分析路径步骤,包括:根据路由基线,获取虚拟机VM1a至VM1b方向的转发路径中所有的网络组件,其中虚拟机的ARP缓存、物理服务器路由表、ARP缓存及路径中的linux网桥qrb01a(物理服务器A)/qbr01b(物理服务器B)、OVS网桥br
‑
int
‑
a(物理服务器A)/br
‑
int
‑
b(物理服务器B)/br
‑
tun
‑
a(物理服务器A)/br
‑
tun
‑
b(物理服务器B)、物...
【专利技术属性】
技术研发人员:武迎春,黎宇,张仕勇,李宜明,徐海,
申请(专利权)人:北京润通丰华科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。