用于在高性能计算环境中支持快速混合重新配置的系统和方法技术方案

技术编号:19075766 阅读:23 留言:0更新日期:2018-09-29 17:49
一种混合重新配置方案,能够允许快速部分网络重新配置,其中在网络的不同子部分中选择不同路由算法。部分重新配置能够比初始完全配置快几个数量级,因此使得有可能在无损网络中考虑性能驱动的重新配置。

【技术实现步骤摘要】
【国外来华专利技术】用于在高性能计算环境中支持快速混合重新配置的系统和方法版权声明本专利文档公开内容的一部分包含受版权保护的素材。版权拥有者不反对任何人对专利文档或专利公开内容按照在专利商标局的专利文件或记录中出现得那样进行的传真复制,但是除此之外在任何情况下都保留所有版权。
本专利技术一般而言涉及计算机系统,尤其涉及使用SR-IOVvSwitch体系架构支持计算机系统虚拟化和实时迁移。
技术介绍
随着更大的云计算体系架构的推出,与传统网络和存储相关联的性能和管理瓶颈已成为重要的问题。人们对使用诸如InfiniBand(IB)技术作为云计算架构的基础越来越感兴趣。这是本专利技术的实施例旨在解决的一般领域。
技术实现思路
根据实施例,系统和方法可以在大规模无损网络中提供性能驱动的重新配置。混合重新配置方案可以允许快速部分网络重新配置,其中在网络的不同子部分中选择不同的路由算法。部分重新配置可以比初始完整配置快几个数量级,因此使得有可能在无损网络中考虑性能驱动的重新配置。所提出的机制利用以下事实:大型HPC系统和云由运行隔离任务的多个租户(例如,不同分区上的不同租户)共享。在这种场景中,不允许租户间通信,因此工作负载部署和放置调度器应当尽量避免分段,以确保高效的资源利用。即,每一个租户的大部分流量可以被包含在网络的经整合的子部分中,SM可以重新配置某些子部分,以提高整体性能。SM可以使用胖树(Fat-Tree)拓扑和胖树路由算法。这种混合重新配置方案可以通过使用定制胖树路由算法成功地重新配置和改进子树内的性能,其中该定制胖树路由算法使用提供的节点排序来重新配置网络。当SM想要重新配置整个网络时,SM可以使用默认的胖树路由算法,从而有效地展示针对不同用例的两种不同路由算法在单个子网中的组合。根据实施例,用于在高性能计算环境中支持快速混合重新配置的示例性方法可以在一个或多个微处理器处提供第一子网,该第一子网包括:多个交换机,多个交换机包括至少叶子交换机,其中多个交换机中的每一个交换机包括多个交换机端口;多个主机通道适配器,每一个主机通道适配器包括至少一个主机通道适配器端口;以及多个端节点,其中多个端节点中的每一个端节点与多个主机通道适配器中的至少一个主机通道适配器相关联。该方法可以将第一子网的多个交换机布置在具有多个级别的网络体系架构中,该多个级别中的每一个级别包括该多个交换机中的至少一个交换机。该方法可以根据第一配置方法配置多个交换机,第一配置方法与多个端节点的第一排序相关联。该方法可以将多个交换机的子集配置为第一子网的子子网(sub-subnet),第一子网的子子网包括比第一子网的多个级别少的级别数量。然后,该方法可以根据第二配置方法重新配置第一子网的该子子网。附图说明图1示出了根据实施例的InfiniBand(无限带宽)环境的图示。图2示出了根据实施例的网络环境中的树形拓扑的图示。图3示出了根据实施例的示例性共享端口体系架构。图4示出了根据实施例的示例性vSwitch体系架构。图5示出了根据实施例的具有预填充的LID的示例性vSwitch体系架构。图6示出了根据实施例的具有动态LID分配的示例性vSwitch体系架构。图7示出了根据实施例的具有带有动态LID分配和预填充的LID的vSwitch的示例性vSwitch体系架构。图8图示了根据实施例的交换机元组。图9示出了根据实施例的用于节点路由阶段的系统。图10示出了根据实施例的用于节点路由阶段的系统。图11示出了根据实施例的用于节点路由阶段的系统。图12示出了根据实施例的用于节点路由阶段的系统。图13示出了根据实施例的包括具有多于两个级别的胖树拓扑的系统。图14示出了根据实施例的用于快速混合重新配置的系统。图15示出了根据实施例的用于快速混合重新配置的系统。图16是根据实施例的用于在高性能计算环境中支持快速混合重新配置的示例性方法的流程图。具体实施方式在附图的各图中通过示例而非限制的方式图示了本专利技术,附图中相同的标号指示类似的元件。应当注意的是,在本公开中对“一个”或“一些”实施例的引用不一定是相同的实施例,并且这种引用意味着至少一个。虽然讨论了特定的实现方式,但是应当理解的是,特定实现方式仅仅是为了说明性目的而提供。相关领域的技术人员将认识到,在不脱离本专利技术的范围和精神的情况下,可以使用其它部件和配置。贯穿附图和具体实施方式可以使用共同的标号来指示相同的元素;因此,如果元素在其它地方进行了描述,那么在图中使用的标号可以或可以不在特定于该图的具体描述中被引用。本文描述是是支持在高性能计算环境中的快速混合重新配置的系统和方法。本专利技术的以下描述使用InfiniBandTM(IB)网络作为高性能网络的示例。对于本领域技术人员来说清楚的是,可以使用其它类型的高性能网络而没有限制。以下描述还使用胖树拓扑作为架构拓扑的示例。对于本领域技术人员来说清楚的是,可以使用其它类型的架构拓扑而没有限制。根据本专利技术的实施例,虚拟化可以有益于云计算中的高效资源利用和弹性资源分配。实时迁移使得有可能通过以应用透明的方式在物理服务器之间移动虚拟机(VM)来优化资源使用。因此,虚拟化可以通过实时迁移实现整合、资源的按需供给以及弹性。InfiniBandTMInfiniBandTM(IB)是由InfiniBandTM贸易协会开发的开放标准无损网络技术。该技术基于提供高吞吐量和低延迟通信的串行点对点全双工互连,特别针对高性能计算(HPC)应用和数据中心。InfiniBandTM体系架构(IBA)支持双层拓扑划分。在下层,IB网络被称为子网,其中子网可以包括使用交换机和点对点链路互连的主机的集合。在上层,IB架构构成可以使用路由器互连的一个或多个子网。在子网内,可以使用交换机和点对点链路来连接主机。此外,可以存在主管理实体——子网管理器(SM),其驻留在子网中的指定子网设备上。子网管理器负责配置、激活和维护IB子网。另外,子网管理器(SM)可以负责在IB架构中执行路由表计算。这里,例如,IB网络的路由旨在在本地子网中的所有源和目的地对之间进行适当的负载平衡。通过子网管理接口,子网管理器与子网管理代理(SMA)交换被称为子网管理分组(SMP)的控制分组。子网管理代理驻留在每一个IB子网设备上。通过使用SMP,子网管理器能够发现架构、配置端节点和交换机,并从SMA接收通知。根据实施例,IB网络中的子网间和子网内路由可以基于存储在交换机中的LFT。LFT是由SM根据使用的路由机制计算的。在子网中,使用本地标识符(LID)来寻址端节点和交换机上的主机通道适配器(HCA)端口。LFT中的每一个条目由目的地LID(DLID)和输出端口组成。表中每一个LID只支持一个条目。当分组到达交换机时,其输出端口通过在该交换机的转发表中查找DLID来确定。路由是确定性的,因为分组在给定的源-目的地对(LID对)之间采用网络中的相同路径。一般而言,除了主子网管理器之外的所有其它子网管理器都在备用模式下动作以用于容错。但是,在主子网管理器发生故障的情况下,由备用子网管理器协商新的主子网管理器。主子网管理器还执行子网的周期性扫描,以检测任何拓扑变化并相应地重新配置网络。此外,可以使用本地标识符(LID)来寻址子网内的主机和交换机,并且可以本文档来自技高网...

【技术保护点】
1.一种用于在高性能计算环境中支持快速混合重新配置的系统,包括:一个或多个微处理器;第一子网,所述第一子网包括:多个交换机,所述多个交换机包括至少叶子交换机,其中所述多个交换机中的每一个交换机包括多个交换机端口,多个主机通道适配器,每一个主机通道适配器包括至少一个主机通道适配器端口,多个端节点,其中所述多个端节点中的每一个端节点与所述多个主机通道适配器中的至少一个主机通道适配器相关联;其中第一子网的所述多个交换机布置在具有多个级别的网络体系架构中,所述多个级别中的每一个级别包括所述多个交换机中的至少一个交换机;其中根据第一配置方法初始地配置所述多个交换机,所述第一配置方法与所述多个端节点的第一排序相关联;其中所述多个交换机的子集被配置为第一子网的子子网,第一子网的所述子子网包括少于第一子网的所述多个级别的多个级别;其中根据第二配置方法重新配置第一子网的所述子子网。

【技术特征摘要】
【国外来华专利技术】2016.08.23 US 62/378,5831.一种用于在高性能计算环境中支持快速混合重新配置的系统,包括:一个或多个微处理器;第一子网,所述第一子网包括:多个交换机,所述多个交换机包括至少叶子交换机,其中所述多个交换机中的每一个交换机包括多个交换机端口,多个主机通道适配器,每一个主机通道适配器包括至少一个主机通道适配器端口,多个端节点,其中所述多个端节点中的每一个端节点与所述多个主机通道适配器中的至少一个主机通道适配器相关联;其中第一子网的所述多个交换机布置在具有多个级别的网络体系架构中,所述多个级别中的每一个级别包括所述多个交换机中的至少一个交换机;其中根据第一配置方法初始地配置所述多个交换机,所述第一配置方法与所述多个端节点的第一排序相关联;其中所述多个交换机的子集被配置为第一子网的子子网,第一子网的所述子子网包括少于第一子网的所述多个级别的多个级别;其中根据第二配置方法重新配置第一子网的所述子子网。2.如权利要求1所述的系统,其中第一子网的所述多个端节点经由所述多个交换机互连。3.如权利要求2所述的系统,其中所述多个端节点的子集与第一子网的所述子子网相关联;以及其中第一子网的所述子子网被配置为使得所述多个端节点的所述子集之间的流量被限制到被配置为第一子网的所述子子网的所述多个交换机的所述子集。4.如权利要求3所述的系统,其中第二重新配置方法和与第一子网的所述子子网相关联的所述多个端节点的所述子集中的至少两个端节点的第二排序相关联。5.如权利要求4所述的系统,其中从系统管理员接收与第一子网的所述子子网相关联的所述多个端节点的所述子集中的所述至少两个端节点的所述第二排序。6.如权利要求4所述的系统,其中从管理实体接收与第一子网的所述子子网相关联的所述多个端节点的所述子集中的至少两个端节点的所述第二排序。7.如权利要求6所述的系统,其中第一子网包括InfiniBand子网;以及其中所述管理实体是选自包括以下各项的组的管理实体:子网管理器;架构管理器;以及全局架构管理器。8.一种用于在高性能计算环境中支持快速混合重新配置的方法,包括:在一个或多个微处理器处提供第一子网,该第一子网包括:多个交换机,所述多个交换机包括至少叶子交换机,其中所述多个交换机中的每一个交换机包括多个交换机端口,多个主机通道适配器,每一个主机通道适配器包括至少一个主机通道适配器端口,多个端节点,其中所述多个端节点中的每一个端节点与所述多个主机通道适配器中的至少一个主机通道适配器相关联;将第一子网的所述多个交换机布置在具有多个级别的网络体系架构中,所述多个级别中的每一个级别包括所述多个交换机中的至少一个交换机;根据第一配置方法配置所述多个交换机,所述第一配置方法与所述多个端节点的第一排序相关联;将所述多个交换机的子集配置为第一子网的子子网,第一子网的所述子子网包括少于第一子网的所述多个级别的多个级别;根据第二配置方法重新配置第一子网的所述子子网。9.如权利要求8所述的方法,其中第一子网的所述多个端节点经由所述多个交换机互连。10.如权利要求9所述的方法,其中所述多个端节点的子集与第一子网的所述子子网相关联;以及其中第一子网的所述子子网被配置为使得所述多个端节点的所述子集之间的流量被限制到被配置为第一子网的所述子子网的所述多个交...

【专利技术属性】
技术研发人员:E·塔索拉斯E·G·格兰T·斯凯伊B·D·约翰森
申请(专利权)人:甲骨文国际公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1