具有故障转移的快速外围元件互连网络系统与操作方法技术方案

技术编号:15541411 阅读:142 留言:0更新日期:2017-06-05 10:50
一种具有故障转移的快速外围元件互连(PCIe)网络系统与其操作方法。快速外围元件互连(PCIe)网络系统包括管理主机、PCIe交换机、第一非透明桥以及第二非透明桥。PCIe交换机的上游端口电性耦接至管理主机。第一非透明桥配置于PCIe交换机,用以电性耦接至计算主机的第一PCIe端口。第一非透明桥可以将计算主机的第一PCIe端口耦接到管理主机。第二非透明桥配置于PCIe交换机,用以电性耦接至计算主机的第二PCIe端口。第二非透明桥可以将计算主机的第二PCIe端口耦接到管理主机。

Fast peripheral component interconnection network system with fault transfer and operation method

A fast peripheral component interconnection (PCIe) network system with failover and method of operation thereof. Fast peripheral component interconnection (PCIe) network systems include management hosts, PCIe switches, first non transparent bridges, and second non transparent bridges. The upstream port of the PCIe switch is electrically coupled to the management host. The first non transparent bridge is configured on the PCIe switch and is electrically coupled to the first PCIe port of the computing host. The first non transparent bridge may couple the first PCIe port of the computing host to the management host. The second non transparent bridge is configured on the PCIe switch and is electrically coupled to the second PCIe port of the computing host. Second the non transparent bridge can connect the second PCIe port of the computing host to the management host.

【技术实现步骤摘要】
具有故障转移的快速外围元件互连网络系统与操作方法
本公开涉及一种快速外围元件互连(以下称PCIe)装置,且特别涉及一种具有故障转移能力的快速外围元件互连网络系统与操作方法。
技术介绍
快速外围元件互连(PeripheralComponentInterconnectExpress,PCIe)是由PCI特别兴趣小组(PCISpecialInterestGroup,PCI-SIG)开发的工业标准计算机扩展技术(industrystandardcomputerexpansiontechnology)。PCIe最初被设计为一个局部总线互联技术(localbusinterconnecttechnology),用于连接一台机器内的CPU、GPU和I/O设备,并从此进展而成为具有点至点链接(point-to-pointlinks)、逐中继段流量控制(hop-by-hopflowcontrol)、端至端的重发(end-to-endretransmission)等特征的一个完全成熟的交换网络(switchednetwork)。PCIe也可作为多板之间的被动背板互连(passivebackplaneinterconnectamongboards),以及用以连接机器与外部设备(例如存储盒)的扩展接口。PCIe网络是具有串行点对点全双工通道(serialpoint-to-pointfullduplexlanes)的交换式网络。PCIe设备通过由一个或多个通道所组成的链路而连接到此PCIe网络。近日,利用PCIe接口将多个服务器(servers)或虚拟化I/O设备(virtualizedI/Odevices)互连的扩展PCIe已经成为一个有趣的可能性。例如,PCIe的应用可以进一步扩展到机架内部互连(intra-rackinterconnect)。PCIe交换机可以取代标准的机架顶部(topofrack,TOR)以太网交换机(Ethernetswitch),也就是PCIe可以在同一机架内连接多个主机(hosts,例如服务器)。被允许连接到PCIe交换机的输入输出(I/O)设备可以分享于同一个机架内所有服务器。机架中的所有服务器之间也可以通过PCIe链路(PCIelinks)彼此进行通信。扩展PCIe到多服务器环境带来了几个新的挑战。传统的PCIe架构的主要限制是,在任何时间点,每一个PCIe域只有一个活动的根复合(activerootcomplex)。其结果是没有两个服务器被允许共存于相同的PCIe域。为了PCIe成为机架内部主机间通信互连的可行系统,需要额外的故障转移(fail-over)机制,以确保在任何单一控制平台(controlplane)和数据平台(dataplane)故障的情况下网络操作仍能继续进行。
技术实现思路
本公开提供一种快速外围元件互连(以下称PCIe)网络系统与其操作方法,在PCIe网络环境中具有故障转移(fail-over)能力。本公开的实施例提供一种PCIe网络系统,包括第一管理主机、PCIe交换机、第一非透明桥以及第二非透明桥。PCIe交换机的第一上游端口电性耦接至第一管理主机。第一非透明桥配置于PCIe交换机,用以电性耦接至第一计算主机的第一PCIe端口。第一非透明桥可以将第一计算主机的第一PCIe端口耦接到第一管理主机。第二非透明桥配置于PCIe交换机,用以电性耦接至第一计算主机的第二PCIe端口。第二非透明桥可以将第一计算主机的第二PCIe端口耦接到第一管理主机。本公开的实施例提供一种PCIe网络系统的操作方法,包括:配置第一管理主机;配置PCIe交换机,其中PCIe交换机的第一上游端口电性耦接至第一管理主机;配置第一非透明桥于PCIe交换机,用以电性耦接至第一计算主机的第一PCIe端口;配置第二非透明桥于PCIe交换机,用以电性耦接至第一计算主机的第二PCIe端口;由第一非透明桥将第一计算主机的第一PCIe端口耦接到第一管理主机;以及由第二非透明桥将第一计算主机的第二PCIe端口耦接到第一管理主机。本公开的实施例提供一种PCIe网络系统,包括PCIe交换机、第一管理主机、第二管理主机以及第一非透明桥。第一管理主机电性耦接至PCIe交换机的第一上游端口。第二管理主机电性耦接至PCIe交换机的第二上游端口。第一非透明桥配置于PCIe交换机,用以电性耦接至第一计算主机的PCIe端口。当第一管理主机管理PCIe交换机时,第一非透明桥可以将第一计算主机的PCIe端口耦接到第一管理主机。当第二管理主机检测到第一管理主机故障时,第二管理主机进行故障转移程序以取代第一管理主机来管理PCIe交换机,使得第一非透明桥将第一计算主机的PCIe端口改为耦接到第二管理主机。本公开的实施例提供一种PCIe网络系统的操作方法,包括:配置PCIe交换机;配置第一管理主机,其中第一管理主机电性耦接至PCIe交换机的第一上游端口;配置第二管理主机,其中第二管理主机电性耦接至该PCIe交换机的第二上游端口;以及配置第一非透明桥于PCIe交换机,用以电性耦接至第一计算主机的PCIe端口;当第一管理主机管理PCIe交换机时,由第一非透明桥将第一计算主机的PCIe端口耦接到第一管理主机;以及当第二管理主机检测到第一管理主机故障时,由第二管理主机进行故障转移程序以取代第一管理主机来管理PCIe交换机,使得第一非透明桥将第一计算主机的PCIe端口改为耦接到第二管理主机。基于上述,本公开实施例所述PCIe网络系统与操作方法提出了一个基于容错PCIe的局域网络架构(fault-tolerantPCIe-basedareanetworkarchitecture),其中结合了故障转移机制。所述PCIe网络系统与操作方法采取了PCIe架构特性的有效优点,并显著减少了由PCIe根复合(PCIerootcomplex)或PCIe链路/开关(PCIelink/switch)的故障所造成的服务中断时间(servicedisruptiontime)。为让本公开的上述特征和优点能更明显易懂,下文特举实施例,并配合附图作详细说明如下。附图说明图1是依照本公开实施例说明一种快速外围元件互连(PCIe)网络系统的电路方块图。图2与图3是依照本公开一实施例说明图1所示管理主机、计算主机与计算主机的存储器地址空间示意图。图4是依照本公开实施例说明图1所示PCIe网络系统的操作方法的流程示意图。图5是依照本公开另一实施例说明图1所示PCIe网络系统的操作方法的流程示意图。图6是依照本公开实施例说明图5所示步骤S540的详细流程示意图。图7是依照本公开实施例说明图1所示管理主机的操作时序示意图。【符号说明】100:PCIe网络系统110:PCIe交换机111:第一上游端口112:第二上游端口121:第一管理主机122:第二管理主机123:以太网络131:第一计算主机132:第二计算主机133:第三计算主机134:第四计算主机141:第一非透明桥142:第二非透明桥143:第三非透明桥144:第四非透明桥145:第五非透明桥146:第六非透明桥147:第七非透明桥148:第八非透明桥151:第一以太网络接口卡152:第二以太网络接口卡161、162:PCIe本文档来自技高网
...
具有故障转移的快速外围元件互连网络系统与操作方法

【技术保护点】
一种快速外围元件互连网络系统,其特征在于,所述快速外围元件互连网络系统包括:第一管理主机;快速外围元件互连交换机,其中该快速外围元件互连交换机的第一上游端口电性耦接至该第一管理主机;第一非透明桥,配置于该快速外围元件互连交换机,用以电性耦接至第一计算主机的第一快速外围元件互连端口,其中该第一非透明桥用以将该第一计算主机的该第一快速外围元件互连端口耦接到该第一管理主机;以及第二非透明桥,配置于该快速外围元件互连交换机,用以电性耦接至该第一计算主机的第二快速外围元件互连端口,其中该第二非透明桥用以将该第一计算主机的该第二快速外围元件互连端口耦接到该第一管理主机。

【技术特征摘要】
2015.11.25 TW 1041392591.一种快速外围元件互连网络系统,其特征在于,所述快速外围元件互连网络系统包括:第一管理主机;快速外围元件互连交换机,其中该快速外围元件互连交换机的第一上游端口电性耦接至该第一管理主机;第一非透明桥,配置于该快速外围元件互连交换机,用以电性耦接至第一计算主机的第一快速外围元件互连端口,其中该第一非透明桥用以将该第一计算主机的该第一快速外围元件互连端口耦接到该第一管理主机;以及第二非透明桥,配置于该快速外围元件互连交换机,用以电性耦接至该第一计算主机的第二快速外围元件互连端口,其中该第二非透明桥用以将该第一计算主机的该第二快速外围元件互连端口耦接到该第一管理主机。2.如权利要求1所述的快速外围元件互连网络系统,其特征在于,该第一管理主机的第一扩展存储器地址通过该快速外围元件互连交换机的该第一非透明桥映射到该第一计算主机的本地存储器地址,以及该第一管理主机的第二扩展存储器地址通过该快速外围元件互连交换机的该第二非透明桥映射到该第一计算主机的该本地存储器地址。3.如权利要求1所述的快速外围元件互连网络系统,其特征在于,该第一计算主机的第一扩展存储器地址通过该快速外围元件互连交换机的该第一非透明桥映射到该第一管理主机的本地存储器地址,以及该第一计算主机的第二扩展存储器地址通过该快速外围元件互连交换机的该第二非透明桥映射到该第一管理主机的该本地存储器地址。4.如权利要求1所述的快速外围元件互连网络系统,其特征在于,该第一管理主机的全域存储器地址空间被定义多个地址区间,这些地址区间中的第一地址区间被分配作为该第一管理主机的本地存储器地址,该第一管理主机使用这些地址区间中的第二地址区间经由该快速外围元件互连交换机的该第一非透明桥存取位于该第一计算主机的本地存储器地址的资源,以及该第一管理主机使用这些地址区间中的第三地址区间经由该快速外围元件互连交换机的该第二非透明桥存取位于该第一计算主机的该本地存储器地址的资源。5.如权利要求1所述的快速外围元件互连网络系统,其特征在于,该第一计算主机的全域存储器地址空间被定义多个地址区间,这些地址区间中的第一地址区间被分配作为该第一计算主机的本地存储器地址,该第一计算主机使用这些地址区间中的第二地址区间经由该PCIe交换机的该第一非透明桥存取位于该第一管理主机的本地存储器地址的资源,以及该第一计算主机使用这些地址区间中的第三地址区间经由该PCIe交换机的该第二非透明桥存取位于该第一管理主机的该本地存储器地址的资源。6.如权利要求1所述的快速外围元件互连网络系统,其特征在于,所述快速外围元件互连网络系统还包括:第三非透明桥,配置于该快速外围元件互连交换机,用以电性耦接至第二计算主机的第一快速外围元件互连端口,其中该第三非透明桥用以将该第二计算主机的该第一快速外围元件互连端口耦接到该第一管理主机;以及第四非透明桥,配置于该快速外围元件互连交换机,用以电性耦接至该第二计算主机的第二快速外围元件互连端口,其中该第四非透明桥用以将该第二计算主机的该第二快速外围元件互连端口耦接到该第一管理主机。7.如权利要求6所述的快速外围元件互连网络系统,其特征在于,该第一计算主机的第一扩展存储器地址通过该快速外围元件互连交换机的该第一非透明桥映射到该第一管理主机的第二扩展存储器地址,该第一管理主机的该第二扩展存储器地址通过该快速外围元件互连交换机的该第三非透明桥映射到该第二计算主机的本地存储器地址,该第一计算主机的第三扩展存储器地址通过该快速外围元件互连交换机的该第二非透明桥映射到该第一管理主机的第四扩展存储器地址,以及该第一管理主机的该第四扩展存储器地址通过该快速外围元件互连交换机的该第四非透明桥映射到该第二计算主机的该本地存储器地址。8.如权利要求6所述的快速外围元件互连网络系统,其特征在于,该第一计算主机的全域存储器地址空间被定义多个地址区间,这些地址区间中的第一地址区间被分配作为该第一计算主机的本地存储器地址,该第一计算主机使用这些地址区间中的第二地址区间经由该快速外围元件互连交换机的该第一非透明桥与该第一管理主机存取位于该第二计算主机的本地存储器地址的资源,以及该第一计算主机使用这些地址区间中的第三地址区间经由该快速外围元件互连交换机的该第二非透明桥与该第一管理主机存取位于该第二计算主机的该本地存储器地址的资源。9.如权利要求1所述的快速外围元件互连网络系统,其特征在于,所述快速外围元件互连网络系统还包括:第二管理主机,电性耦接至该快速外围元件互连交换机的第二上游端口,其中当该第二管理主机检测到该第一管理主机故障时,该第二管理主机进行故障转移程序以取代该第一管理主机来管理该快速外围元件互连交换机。10.如权利要求9所述的快速外围元件互连网络系统,其特征在于,该快速外围元件互连交换机被划分为多个虚拟交换机,这些虚拟交换机中的第一虚拟交换机具有该第一上游端口,这些虚拟交换机中的第二虚拟交换机具有该第二上游端口,其中当该第一管理主机管理该快速外围元件互连交换机时,该快速外围元件互连交换机的所有下游端口被分配给该第一虚拟交换机,而该第二虚拟交换机只有该第二上游端口。11.如权利要求10所述的快速外围元件互连网络系统,其特征在于,该故障转移程序包括:由该第二管理主机控制该快速外围元件互连交换机以使该第一虚拟交换机的所有下游端口改为分配给该第二虚拟交换机,而该第一虚拟交换机只有该第一上游端口;由该第二管理主机使用该第二管理主机的运行内核映像自我重新启动;由该第一管理主机使用该第一管理主机的控制器内核映像自我重新启动,以及将该第一管理主机的一模板内核映像复制为该第一管理主机的一运行内核映像;以及由该第一管理主机使用该第一管理主机的该控制器内核映像自我重新启动,以及监视该第二管理主机的状况。12.一种快速外围元件互连网络系统的操作方法,其特征在于,所述操作方法包括:配置第一管理主机;配置快速外围元件互连交换机,其中该快速外围元件互连交换机的第一上游端口电性耦接至该第一管理主机;配置第一非透明桥于该快速外围元件互连交换机,用以电性耦接至第一计算主机的第一快速外围元件互连端口;配置第二非透明桥于该快速外围元件互连交换机,用以电性耦接至该第一计算主机的第二快速外围元件互连端口;由该第一非透明桥将该第一计算主机的该第一快速外围元件互连端口耦接到该第一管理主机;以及由该第二非透明桥将该第一计算主机的该第二快速外围元件互连端口耦接到该第一管理主机。13.如权利要求12所述的快速外围元件互连网络系统的操作方法,其特征在于,该第一管理主机的第一扩展存储器地址通过该快速外围元件互连交换机的该第一非透明桥映射到该第一计算主机的本地存储器地址,以及该第一管理主机的第二扩展存储器地址通过该快速外围元件互连交换机的该第二非透明桥映射到该第一计算主机的该本地存储器地址。14.如权利要求12所述的快速外围元件互连网络系统的操作方法,其特征在于,该第一计算主机的第一扩展存储器地址通过该快速外围元件互连交换机的该第一非透明桥映射到该第一管理主机的本地存储器地址,以及该第一计算主机的第二扩展存储器地址通过该PCIe交换机的该第二非透明桥映射到该第一管理主机的该本地存储器地址。15.如权利要求12所述的快速外围元件互连网络系统的操作方法,其特征在于,所述操作方法还包括:将该第一管理主机的全域存储器地址空间定义为多个地址区间;将该第一管理主机的这些地址区间中的第一地址区间分配作为该第一管理主机的本地存储器地址;由该第一管理主机使用这些地址区间中的第二地址区间经由该快速外围元件互连交换机的该第一非透明桥存取位于该第一计算主机的本地存储器地址的资源;以及由该第一管理主机使用这些地址区间中的第三地址区间经由该快速外围元件互连交换机的该第二非透明桥存取位于该第一计算主机的该本地存储器地址的资源。16.如权利要求12所述的快速外围元件互连网络系统的操作方法,其特征在于,所述操作方法还包括:将该第一计算主机的全域存储器地址空间定义为多个地址区间;将这些地址区间中的第一地址区间分配作为该第一计算主机的本地存储器地址;由该第一计算主机使用这些地址区间中的第二地址区间经由该快速外围元件互连交换机的该第一非透明桥存取位于该第一管理主机的本地存储器地址的资源;以及由该第一计算主机使用这些地址区间中的第三地址区间经由该快速外围元件互连交换机的该第二非透明桥存取位于该第一管理主机的该本地存储器地址的资源。17.如权利要求12所述的快速外围元件互连网络系统的操作方法,其特征在于,所述操作方法还包括:配置第三非透明桥于该快速外围元件互连交换机,用以电性耦接至第二计算主机的第一快速外围元件互连端口;配置第四非透明桥于该快速外围元件互连交换机,用以电性耦接至该第二计算主机的第二快速外围元件互连端口;由该第三非透明桥将该第二计算主机的该第一快速外围元件互连端口耦接到该第一管理主机;以及由该第四非透明桥将该第二计算主机的该第二快速外围元件互连端口耦接到该第一管理主机。18.如权利要求17所述的快速外围元件互连网络系统的操作方法,其特征在于,该第一计算主机的第一扩展存储器地址通过该快速外围元件互连交换机的该第一非透明桥映射到该第一管理主机的第二扩展存储器地址,该第一管理主机的该第二扩展存储器地址通过该快速外围元件互连交换机的该第三非透明桥映射到该第二计算主机的本地存储器地址,该第一计算主机的第三扩展存储器地址通过该快速外围元件互连交换机的该第二非透明桥映射到该第一管理主机的第四扩展存储器地址,以及该第一管理主机的该第四扩展存储器地址通过该快速外围元件互连交换机的该第四非透明桥映射到该第二计算主机的该本地存储器地址。19.如权利要求17所述的快速外围元件互连网络系统的操作方法,其特征在于,所述操作方法还包括:将该第一计算主机的全域存储器地址空间定义为多个地址区间;将这些地址区间中的第一地址区间分配作为该第一计算主机的本地存储器地址;由该第一计算主机使用这些地址区间中的第二地址区间经由该PCIe交换机的该第一非透明桥与该第一管理主机存取位于该第二计算主机的本地存储器地址的资源;以及由该第一计算主机使用这些地址区间中的第三地址区间经由该PCIe交换机的该第二非透明桥与该第一管理主机存取位于该第二计算主机的该本地存储器地址的资源。20.如权利要求12所述的快速外围元件互连网络系统的操作方法,其特征在于,所述操作方法还包括:配置第二管理主机,其中该第二管理主机电性耦接...

【专利技术属性】
技术研发人员:李肇棠涂政君阙志克
申请(专利权)人:财团法人工业技术研究院
类型:发明
国别省市:中国台湾,71

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1