虚拟分布式路由环境中的进入ECMP制造技术

技术编号:15198046 阅读:102 留言:0更新日期:2017-04-21 13:40
本公开提供了具有用于将分组从物理主机(PH)路由到逻辑网络的多个指定实例的逻辑路由元件(LRE)。具有多个指定实例的网络段中的PH可以根据负载均衡算法在用于向逻辑网络中的其它网络节点发送网络流量的多个指定实例中进行选择。LRE的每个逻辑接口(LIF)被定义为可通过多个标识符或地址寻址,并且每个LIF标识符或地址被分配给不同的指定实例。

Access to ECMP in a virtual distributed routing environment

The present invention provides a logical routing element (LRE) having a plurality of specified instances for routing packets from a physical host (PH) to a logical network. The PH in a network segment having a plurality of specified instances can be selected in a plurality of specified instances for sending network traffic to other network nodes in a logical network based on a load balancing algorithm. Each logical interface (LIF) of LRE is defined to be addressable by multiple identifiers or addresses, and each LIF identifier or address is assigned to a different instance of the specified.

【技术实现步骤摘要】
【国外来华专利技术】
技术介绍
在网络虚拟化环境中,部署在管理程序(hypervisor)上较常见的应用之一是3层(3-tier)应用,其中web层、数据库层和应用层在不同的L3子网上。这需要穿过一个子网中的一个虚拟机(VM)到另一个子网中的另一个虚拟机的IP(互联网协议)分组首先到达L3路由器,然后利用L2MAC(媒体访问控制)地址被转发到目的地VM。即使目的地VM被托管在与发端VM相同的主机机器上,也是如此。这产生了不必要的网络流量并且导致更高的延迟和更低的吞吐量,这显著地降低了在管理程序上运行的应用的性能。一般而言,每当在两个不同网络段(例如,不同IP子网、不同L2段或不同覆盖逻辑网络)中的任何两个VM彼此通信时,就会发生这种性能降级。图1示出了在网络虚拟化基础设施100上实现的逻辑网络,其中属于不同网络段的虚拟机(VM)121-129通过共享L3路由器110彼此通信。VM121-129在主机机器131-133上运行,它们是通过物理网络105彼此通信地链接并且链接到共享L3路由器110的物理机器。网络段A中的VM只能通过物理网络105与网络段B中的VM以及共享L3路由器110通信,无论VM是在不同的主机机器中(例如,从VM122到VM127)还是在同一主机机器中(例如,从VM125到VM126)。于2013年12月20日提交的美国专利申请14/137,862描述了作为虚拟分布式路由器(VDR)跨不同主机机器分布式操作的逻辑路由器元件(LRE)。每个主机机器将其自己的LRE本地实例操作为受管理物理路由元件(MPRE),用于为在那个主机上运行的VM执行L3分组转发。因此,LRE使得可以在本地(即,在发端管理程序处)转发数据分组,而无需经过共享L3路由器。此外,如美国专利申请14/137,862所描述的LRE不仅为在操作该LRE的主机机器中操作的VM执行L3路由,而且还为不操作LRE的物理路由器/主机或其它网络节点执行L3路由。操作LRE的一个特定主机机器被选择作为指定的主机机器,并且其MPRE是LRE的指定实例,用于处理来自物理路由器的流量的L3路由。
技术实现思路
在一些实施例中,逻辑路由元件(LRE)包括一个或多个逻辑接口(LIF),每个逻辑接口用作到逻辑网络的对应段的接口。每个网络段都有其自己的到LRE的逻辑接口,并且每个LRE都有其自己的一组逻辑接口。在一些实施例中,LRE的LIF中的至少一个被定义为可通过两个或更多个标识符(例如,IP地址)寻址。一些实施例允许每个LIF标识符用作网络流量的目的地地址。在一些实施例中,网络段可以包括多个IP子网,并且与这种网络段接口的LIF可以通过处于不同IP子网中的IP地址寻址。在一些实施例中,作为覆盖封装网络(例如,VXLAN或VLAN)的网络段包括多个IP子网。物理主机(PH)是属于逻辑网络但不操作逻辑网络的LRE的本地实例的网络节点。在一些实施例中,从PH到VM的网络流量由确实操作LRE的本地实例(即,MPRE)的指定主机机器路由。在一些实施例中,在这种指定主机上运行的LRE的本地实例被称为“指定实例”或“DI”。在一些实施例中,逻辑网络(或LRE)具有用于一些或所有网络段的多个指定实例。具有多个指定实例的网络段中的PH可以在多个指定实例中进行选择,用于出于负载均衡目的而向逻辑网络中的其它网络节点发送网络流量。为了支持每个网络段的多个指定实例,在一些实施例中,对应的LIF被定义为可通过多个标识符或地址(例如,IP地址)寻址,其中每个LIF标识符或地址被分配给不同的指定实例。在一些实施例中,每个LIF标识符用作网络流量的目的地地址。分配给特定LIF标识符的每个指定实例(DI)进而处理那个特定分配的LIF标识符的网络流量。一些实施例将那个特定网络段的LIF的IP地址通告为可用的下一跳列表。一旦使指定实例列表对物理主机可用,物理主机就能够选择指定实例中的任何一个作为到逻辑网络中的下一跳。这种选择可以基于任何数量的标准并且可以针对任何数量的目的做出。在一些实施例中,物理主机基于当前网络流量信息选择指定实例作为下一跳,以便均衡不同指定主机机器之间的流量负载。在一些实施例中,PH使用指定实例列表对到逻辑网络的进入网络流量执行ECMP(等价多路径路由)算法。在一些实施例中,来自物理主机(PH)的分组依赖指定实例中的路由表条目以进行路由。在一些实施例中,这些条目由被PH或被DI自身发起的地址解析协议(ARP)填充。在一些实施例中,已接收到作为下一跳的IP地址列表的PH执行ARP操作来将接收到的L3IP地址转换为L2MAC地址,以便确定指定实例的PMAC地址。在一些实施例中,指定实例不仅为来自外部PH的分组解析IP地址,而且为来自在具有LRE的本地实例的主机机器上运行的VM的分组解析IP地址。路由利用在特定LIF的可用指定实例中的路由表条目。在一些实施例中,每个MPRE基于目的地IP地址选择用于请求地址解析的指定实例。在一些实施例中,这种地址解析请求和地址解析应答是UDP消息。在一些实施例中,MPRE将向与处于与目的地IP地址相同IP子网中的LIF地址相关联的指定实例做出这种地址解析请求。在一些实施例中,每个指定实例用于解析处于与其分配的LIFIP地址在相同子网中的IP地址。在一些实施例中,当指定实例在接收到地址解析请求时不能解析目的地IP地址时,它将执行ARP操作以便解析未知的IP地址。前面的
技术实现思路
旨在用作对本专利技术的一些实施例的简要介绍。它并不意味着是本文档中所公开的所有专利技术性主题的介绍或概述。以下的具体实施方式和具体实施方式中参考的附图说明将进一步描述在
技术实现思路
以及其它实施例中所描述的实施例。因此,为了理解本文档所描述的所有实施例,需要对
技术实现思路
、具体实施方式和附图说明进行全面地阅读。此外,所要求保护的主题不受在
技术实现思路
、具体实施方式和附图说明中的说明性细节的限制,而是要由所附权利要求来限定,这是因为所要求保护的主题可以在不背离本主题的精神的情况下以其它特定的形式来体现。附图说明本专利技术的新颖特征在所附权利要求中阐述。但是,出于解释的目的,本专利技术的若干种实施例在以下图中阐述。图1示出了在网络虚拟化基础设施上实现的逻辑网络,其中不同段或子网上的虚拟机(VM)通过共享路由器通信。图2概念性地示出了使用LRE实现网络节点之间的L3分组转发的虚拟化网络环境。图3示出了与包括一个或多个IP子网的网络段接口的LIF。图4示出了在网络虚拟化基础设施的主机机器中的LRE的物理实现。图5示出了运行包括LRE的MPRE的虚拟化软件的主机机器。图6示出了使用MPRE为不同主机机器中的VM执行分布式L3路由。图7示出了从VM到PH的数据分组的分布式L3路由。图8概念性地示出了用于逻辑网络中的LIF的多个指定实例。图9示出了通过利用两个不同的指定实例在逻辑网络中分组从PH到VM的L3路由。图10概念性地示出了LRE,其中每个LIF具有多个IP地址,并且每个IP地址具有其自己对应的指定实例。图11概念性地示出了具有基于图10的LRE实现逻辑网络的主机机器的网络虚拟化基础设施。图12概念性地示出了将LIFIP地址作为下一跳列表通告给网络虚拟化基础设施中的物理主机。图13示出了其中用于进入到逻辑网络中的进本文档来自技高网
...
虚拟分布式路由环境中的进入ECMP

【技术保护点】
一种在包括多个主机机器的网络虚拟化基础设施上操作逻辑网络的方法,所述方法包括:定义用于在逻辑网络的不同段之间路由数据分组的逻辑路由元件(LRE),其中每个主机机器将一组虚拟机(VM)和LRE的本地实例操作为受管理物理路由元件(MPRE),所述MPRE用于在主机机器处本地路由来自所述一组VM的分组,所述LRE包括多个逻辑接口(LIF),每个LIF用于与逻辑网络的不同段接口,其中特定LIF能通过多个不同的LIF地址寻址;将特定LIF的每个LIF地址分配给所述多个主机机器中的不同主机机器;及将所述特定LIF的所述多个LIF地址作为多个下一跳通告给外部路由器。

【技术特征摘要】
【国外来华专利技术】2014.03.27 US 14/227,964;2014.03.27 US 14/227,9591.一种在包括多个主机机器的网络虚拟化基础设施上操作逻辑网络的方法,所述方法包括:定义用于在逻辑网络的不同段之间路由数据分组的逻辑路由元件(LRE),其中每个主机机器将一组虚拟机(VM)和LRE的本地实例操作为受管理物理路由元件(MPRE),所述MPRE用于在主机机器处本地路由来自所述一组VM的分组,所述LRE包括多个逻辑接口(LIF),每个LIF用于与逻辑网络的不同段接口,其中特定LIF能通过多个不同的LIF地址寻址;将特定LIF的每个LIF地址分配给所述多个主机机器中的不同主机机器;及将所述特定LIF的所述多个LIF地址作为多个下一跳通告给外部路由器。2.如权利要求1所述的方法,其中所述网络段中的至少一个包括在多个不同IP子网中的网络节点。3.如权利要求1所述的方法,其中用于寻址所述特定LIF的多个不同LIF地址包括在不同IP子网中的地址。4.如权利要求1所述的方法,其中所述特定LIF用于与特定网络段接口,其中所述特定网络段是覆盖封装网络。5.如权利要求4所述的方法,其中覆盖封装网络包括多个不同的IP子网。6.如权利要求4所述的方法,其中覆盖封装网络是VXLAN。7.一种方法,包括:将物理路由器连接到逻辑网络,所述逻辑网络包括多个网络段和用于在所述多个网络段之间路由数据分组的逻辑路由元件(LRE),所述LRE包括多个逻辑接口(LIF),每个LIF用于与网络段接口,其中物理路由器是在特定LIF处与LRE接口但不操作所述LRE的特定网络段的网络节点;及在物理路由器处接收用于寻址所述特定LIF的多个不同地址;及选择接收到的多个不同地址中的一个地址作为用于将数据分组发送到所述特定LIF的目的地。8.如权利要求7所述的方法,其中选择所述多个不同地址中的一个地址包括执行等价多路径路由(ECMP)算法。9.如权利要求7所述的方法,其中逻辑网络在多个主机机器上实现,其中每个主机机器正将所述LRE的本地实例操作为受管理物理路由元件(MPRE)。10.如权利要求9所述的方法,其中选定的地址对应于特定主机机器,其中所述数据分组的所述路由由所述特定主机机器中的MPRE执行。11.如权利要求7所述的方法,其中所述网络段中的至少一个包括多个不同IP子网中的网络节点。12.如权利要求7所述的方法,其中接收到的用于寻址所述特定LIF的多个地址包括在不同IP子网中的地址。13.如权利要求7所述的方法,其中特定网络段是覆盖封装网络。14.一种系统,包括:多个主机机器,每个主机机器操作一组虚拟机(VM)和用于在逻辑网络的不同网络段之间路由数据分组的逻辑路由元件(LRE)的实例,其中所述LRE包括多个逻辑接口(LIF),每个LIF用于与逻辑网络的网络段接口,其中特定LIF与多个网络层地址相关联,其中所述特定LIF的每个网络层地址被分配给不同主机机器;及物理路由器,其通过向被分配所述特定LIF的网络层地址的主机机器发送数据分组来使用LRE用于路由。15.如权利要求14所述的系统,其中物理路由器是与所述特定LIF接口的特定网络段中的网络节点。16.如权利要求14所述的系统,其中物理路由器通过从所述一组主机机器中选择一主机机器作为数据分组的接收者来均衡所述一组主机机器中的不同主机机器之间的流量负载。17.如权利要求14所述的系统,其中在主机机器中操作的LRE的实例正在充当主机机器的受管理物理路由元件(MPRE),其中所述MPRE在主机机器处本地路由来自所述主机机器的VM的分组。18.如权利要求14所述的系统,其中所述网络段中的至少一个网络段包括多个不同IP子网中的网络节点。19.如权利要求18所述的系统,其中所述至少一个网络段是覆盖封装网络。20.如权利要求14所述的系统,其中所述特定LIF的多个网络层地址包括在不同IP子网中的IP地址。21.一种用作逻辑网络中的主机机器的计算设备,所述计算设备执行包括指令集的计算机程序,所述计算设备用于:执行在逻辑网络的多个不同段中的多个虚拟机;将逻辑路由元件(LRE)的实例操作为用于在逻辑网络的不同段之间路由数据分组的受管理物理路由元件(MPRE...

【专利技术属性】
技术研发人员:V·埃加瓦尔G·钱德拉谢卡R·K·夏布拉玛尼亚R·D·辛格H·王
申请(专利权)人:NICIRA股份有限公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1