一种超级计算机的网络拓扑构建方法及网络拓扑结构技术

技术编号:39311318 阅读:10 留言:0更新日期:2023-11-12 15:56
本发明专利技术涉及超级计算机技术领域,公开了一种超级计算机的网络拓扑构建方法及网络拓扑结构,该方法,将计算结点划分成组、将I/O转发结点分组放置,并改变I/O转发方式,使得计算结点只能共享使用本组内的I/O转发结点。本发明专利技术解决了现有技术存在的以下问题:在二维网络中产生大量聚集的通信数据包,造成通信阻塞,严重影响了互连通信系统的运行稳定性,并影响了I/O效率等。I/O效率等。I/O效率等。

【技术实现步骤摘要】
一种超级计算机的网络拓扑构建方法及网络拓扑结构


[0001]本专利技术涉及超级计算机
,具体是一种超级计算机的网络拓扑构建方法及网络拓扑结构。

技术介绍

[0002]为了简化超级计算机系统的网络拓扑结构,提高超级计算机系统的运行稳定性,当前大型超级计算机普遍采用了I/O转发架构。如图1所示,计算结点与I/O转发结点通过计算网络互连,I/O转发结点与存储结点通过存储网络互连。作业运行在计算结点上,当作业需要读写数据时,其I/O请求从计算结点发送给I/O转发结点,由I/O转发结点转发给存储结点。计算结点的数据读写请求须经I/O转发结点转发后才可发送给存储结点。
[0003]在采用二维网络拓扑的超级计算机中,计算网络采用二维网络结构。如图2所示,网络中的结点(包括计算结点与I/O转发结点)被分组(如64个或128个)放置在机框中,机框内的结点间只需通过框内交换板即可互连通信。在网络逻辑拓扑中,机框是二维网络中的最小连接单位,机框以行列形式呈二维排列。同一行的机框连接着同一个交换机,并且同一列的机框连接着同一个交换机,即每个机框同时连接着一个行交换机与一个列交换机。同行的机框之间只需通过该行的1个交换机即可互连,同列的机框之间只需通过该列的1个交换机即可互连。不同行且不同列的机框必须通过两个交换机才能互连,例如机框F00中的计算结点与机框F11中的计算结点通信,须先经过行交换机R0跳转至该两机框的行列交点处的机框F03,再经过列交换机C3跳转至目的机框F11。可见,在采用二维网络拓扑的超级计算机中,框内结点间通信的网络距离最短,同行或同列的框间通信网络距离次之,不同行且不同列的框间通信网络距离最长。在超级计算机生产系统中,跨行跨列的通信不但会增加通信延迟,影响通信效率,更会造成二维网络中的通信泛洪,易造成通信阻塞,影响通信系统运行稳定性。因此采用二维网络拓扑之后,超级计算机必须尽量减少跨行跨列的通信行为,以提升通信效率与网络稳定性。
[0004]然而,目前在采用二维胖树网络拓扑的超级计算机中,I/O转发架构设计仍存在一定优化空间。在超级计算机的实际部署中,考虑到设计与维护的便利性,通常将I/O转发结点集中放置在一个或少数几个机框中。例如,在图2所示的超级计算机中,I/O转发结点全部位于机框F15中,该种I/O转发架构存在以下两个方面的问题:(1)有3个机框(F03、F07、F11)的计算结点与I/O转发结点处于同一列中,通信需经过1台列交换机(C3);有3个机框(F12、F13、F14)的计算结点与I/O转发结点处于同一行中,通信需经过1台行交换机(R3);有9个机框(F00~F02、F04~F06、F08~F10)的计算结点与I/O转发结点既不在同一行中,也不在同一列中,通信需经过2台交换机。上述现象将会产生两个方面的性能影响,一是由于大部分机框的计算结点需要经过跨行跨列通信才能与I/O转发结点通信,严重影响了这些计算结点的数据读写效率,并造成二维网络上的通信泛洪,造成网络互连系统运行不稳定;二是集群系统中所有的I/O流量都将发往机框F15中的I/O转发结点,造成该机框的通信负载较大,该机框的运行稳定性也将受到影响。
[0005](2)当前I/O转发构架多采用集中映射的方式,即同一个或相邻几个机框里的计算结点共享使用一个I/O转发结点。例如,在图2中机框F00中计算结点的I/O请求全部交由机框F15中的I/O转发结点A处理,类似的,机框F01中计算结点与I/O转发结点B对应。据统计,一个作业更容易被分配到相邻的计算结点,因此相邻的计算结点更容易同时读写数据,这将造成一小部分I/O转发结点过载,导致负载不均。
[0006]由于I/O转发结点是连接计算结点与存储服务器的桥梁,I/O转发结点承担了超级计算机系统上所有的I/O流量,在以上存储转发架构下,几乎所有的I/O流量都必须跨行跨列与一小部分I/O转发结点通信,在二维网络中产生大量聚集的通信数据包,造成通信阻塞,严重影响了互连通信系统的运行稳定性,并影响了I/O效率。
[0007]当前采用二维网络拓扑的超级计算机中,其存储转发架构并没有针对以上“跨行跨列通信问题”进行特殊设计,于是便产生了两个方面的问题。(1)当前的I/O转发结点一般集中地连接在一个或少数几个机框交换板上,因此除了与这些I/O转发结点所在机框同行同列的机框外,绝大部分机框内的计算结点都与I/O转发结点既不同行也不同列,计算结点与I/O转发结点的通信必须经过两台交换机;(2)当前I/O转发构架多采用集中映射的方式,即同一个或相邻几个机框里的计算结点共享使用一个I/O转发结点,据统计,一个作业更容易被分配到相邻的计算结点,因此相邻的计算结点更容易同时读写数据,这将造成一小部分I/O转发结点过载,导致负载不均。由于I/O转发结点是连接计算结点与存储服务器的桥梁,I/O转发结点承担了超级计算机系统上所有的I/O流量,在以上存储转发架构下,几乎所有的I/O流量都必须跨行跨列与一小部分I/O转发结点通信,在二维网络中产生大量聚集的通信数据包,造成通信阻塞,严重影响了互连通信系统的运行稳定性,并影响了I/O效率。

技术实现思路

[0008]为克服现有技术的不足,本专利技术提供了一种超级计算机的网络拓扑构建方法及网络拓扑结构,解决现有技术存在的以下问题:在二维网络中产生大量聚集的通信数据包,造成通信阻塞,严重影响了互连通信系统的运行稳定性,并影响了I/O效率等。
[0009]本专利技术解决上述问题所采用的技术方案是:一种超级计算机的网络拓扑构建方法,将计算结点划分成组、将I/O转发结点分组放置,并改变I/O转发方式,使得计算结点只能共享使用本组内的I/O转发结点。
[0010]作为一种优选的技术方案,在同一组中,I/O转发结点轮询服务相邻计算结点。
[0011]作为一种优选的技术方案,包括以下步骤:S1,将计算结点与I/O转发结点进行分组放置;S2,将计算结点与I/O转发结点进行分组轮询映射。
[0012]作为一种优选的技术方案,步骤S1包括以下步骤:S11,将超级计算机的计算结点按行或按列分组:计算超级计算机二维网络拓扑的行数与列数,比较两值并取较小者,将较小值记为;若,则按行将计算结点分组为组;若,则按列将计算结点分组为组;S12,计算I/O转发结点数量,根据步骤S11得出的分组数量,计算每组平均
分配的I/O转发结点数量;S13,在二维网络的每一组中,根据机框与存储系统的物理位置与二者之间的布线距离,在距存储系统最近的机框中放置个I/O转发结点;S14,将映射方式设置成局部的分组映射模式:每组计算结点无法使用所有的I/O转发结点,只能使用组内的I/O转发结点。
[0013]作为一种优选的技术方案,步骤S14中,若是采用Lustre LNET router的I/O转发架构,则更改router设置,将每个计算结点的router设置成计算结点所在组的I/O转发结点,并重启I/O转发服务。
[0014]作为一种优选的技术方案,步骤S2包括以下步骤:S21本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种超级计算机的网络拓扑构建方法,其特征在于,将计算结点划分成组、将I/O转发结点分组放置,并改变I/O转发方式,使得计算结点只能共享使用本组内的I/O转发结点。2.根据权利要求1所述的一种超级计算机的网络拓扑构建方法,其特征在于,在同一组中,I/O转发结点轮询服务相邻计算结点。3.根据权利要求1或2所述的一种超级计算机的网络拓扑构建方法,其特征在于,包括以下步骤:S1,将计算结点与I/O转发结点进行分组放置;S2,将计算结点与I/O转发结点进行分组轮询映射。4.根据权利要求3所述的一种超级计算机的网络拓扑构建方法,其特征在于,步骤S1包括以下步骤:S11,将超级计算机的计算结点按行或按列分组:计算超级计算机二维网络拓扑的行数与列数,比较两值并取较小者,将较小值记为;若,则按行将计算结点分组为组;若,则按列将计算结点分组为组;S12,计算I/O转发结点数量,根据步骤S11得出的分组数量,计算每组平均分配的I/O转发结点数量;S13,在二维网络的每一组中,根据机框与存储系统的物理位置与二者之间的布线距离,在距存储系统最近的机框中放置个I/O转发结点;S14,将映射方式设置成局部的分组映射模式:每组计算结点无法使用所有的I/O转发结点,只能使用组内的I/O转发结点。5.根据权利要求4所述的一种超级计算机的网络拓扑构建方法,其特征在于,步骤S14中,若是采用Lustre LNET router的I/O转发架构,则更改router设置,将每个计算结点的router设置成计算结点所在组的I/O转发结点,并重启I/O转发服务。6.根据权利要求5所述的一种超级计算...

【专利技术属性】
技术研发人员:喻杰杨文祥邹继铭赖良赵丹王昉
申请(专利权)人:中国空气动力研究与发展中心计算空气动力研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1