使用具有一对多光交换机的光网络的可重新配置的计算平台制造技术

技术编号:26976569 阅读:31 留言:0更新日期:2021-01-06 00:13
方法,系统和装置,包括使用光网络生成计算节点的构建块的集群的装置。在一个方面,一种方法包括接收为计算工作量指定所请求的计算节点的请求数据。该数据指定节点的目标排列。选择超级平台的构建块的子集。确定与目标排列匹配的计算节点的子集的逻辑排列。生成包括构建块的子集的计算节点的工作量集群。对于工作量集群的每个维度,配置用于维度的两个或更多个OCS交换机的相应路由数据。一对多交换机被配置为使得每段计算节点中的第二计算节点被连接到与第二计算节点所连接到的对应段的对应第一计算节点相同的OCS交换机。

【技术实现步骤摘要】
使用具有一对多光交换机的光网络的可重新配置的计算平台
技术介绍
一些计算工作量(例如机器学习训练)需要大量的处理节点来有效地完成工作量。处理节点可以通过互连网络彼此通信。例如,在机器学习训练中,处理节点可以相互通信以收敛于最优的深度学习模型。互连网络对于处理单元实现收敛的速度和效率是关键的。由于机器学习和其它工作工作量在尺寸和复杂性上变化,包括多个处理节点的超级计算机的刚性结构可以限制超级计算机的可用性、可伸缩性和性能。例如,如果具有连接特定处理节点排列的刚性互连网络的超级计算机的一些处理节点发生故障,则超级计算机可能不能替换这些处理节点,从而导致可用性和性能降低。一些特定的排列也可以导致比其它排列更高的性能,而与故障节点无关。
技术实现思路
本说明书描述了涉及可重新配置的计算节点的超级平台(superpod)的技术,使用光网络从超级平台生成工作量集群。通常,本说明书中描述的主题的一个创新方面可以体现在包括接收指定计算工作量的所请求的计算节点的请求数据的方法中。请求数据指定计算节点的目标排列。从包括一组构建块的超级平台中选择所述构建块的子集,所述一组构建块中的每个构建块包括m维度排列的计算节点。每个构建块连接到光网络,该光网络包括用于m维中的每一维的两个或更多个光路交换(OCS)交换机。对于m个维度中的每个维度,每个构建块包括一段或多段沿着维度互连的计算节点。每个段包括在所述段的第一端上的第一计算节点和在所述段的与所述第一端相对的第二端上的第二计算节点。对于m维中的每一维,第一计算节点的第一部分连接到用于该维的两个或更多个OCS交换机中的第一OCS交换机,第一计算节点的一个或多个附加部分连接到用于该维的两个或更多个OCS交换机中的相应附加OCS交换机,并且每个段的第二计算节点连接到具有输入和多个输出的相应一对多光交换机的输入。第一输出连接到第一OCS交换机,并且对于第一计算节点的每个附加部分,相应的附加输出连接到用于第一计算节点的附加部分的附加OCS交换机。确定与计算节点的目标排列相匹配的计算节点的子集的逻辑排列。对于m维中的每一维,逻辑排列限定每个构建块的段与一个或多个其它构建块的对应段之间的连接。生成计算节点的工作量集群,其包括构建块的子集并且基于逻辑排列彼此连接。生成包括为工作量集群的每个维度配置用于维度的两个或更多个OCS交换机中的每一个的相应路由数据。用于工作量集群的每个维度的相应路由数据指定计算工作量的数据如何沿着工作量集群的维度在计算节点之间路由。所述生成还包括基于所述逻辑排列来配置所述一对多交换机的至少一部分,使得每一段计算节点中的所述第二计算节点连接到与所述逻辑排列中所述第二计算节点所连接到的对应段的对应第一计算节点相同的OCS交换机。使所述工作量集群的计算节点执行所述计算工作量。这个和其它方面的其它实施方式包括被配置成执行在计算机存储设备上编码的方法的动作的相应系统,方法和计算机程序。一个或多个计算机的系统可以借助于安装在系统上的软件,固件,硬件或它们的组合来配置,使得在操作中使系统执行动作。一个或多个计算机程序可以通过指令来配置,所述指令在由数据处理装置执行时使所述装置执行所述动作。这些和其它实施方式可以各自可选地包括一个或多个以下特征。在一些方面中,基于逻辑排列来配置一对多交换机的至少一部分,使得计算节点的每一段的第二计算节点连接到与逻辑排列中第二计算节点所连接到的相应段的对应第一计算节点相同的OCS交换机,所述配置可包括针对子集中的第一构建块识别子集中沿着特定维度与第一构建块相邻的第二构建块,以及对于沿着特定维度的第一构建块的每一段,识别第二构建块的对应段,识别第二构建块的对应段的第一计算节点所连接的OCS交换机,以及配置该段所连接的一对多交换机,以将该段的第二计算节点连接到所识别的OCS交换机。在一些方面中,识别所述第二构建块的所述对应段包括识别所述第二构建块的段,所述第二构建块的所述段在所述逻辑排列中沿着所述特定维度、沿着与所述第一构建块的所述段相同的逻辑轴。在一些方面,第一计算节点的一个或多个附加部分是第一计算节点的一个附加部分,一对多光交换机是具有一个输入和两个输出的一对二光交换机;所述第一计算节点的第一部分包括所述第一计算节点的一半,所述第一计算节点的附加部分包括所述第一计算节点的一半。在一些方面中,请求数据指定不同类型的计算节点,且选择构建块的子集包含针对由请求数据指定的每一类型的计算节点选择包含指定类型的一个或多个计算节点的构建块。在一些方面中,用于超级平台的每一维度的相应路由数据可包括用于维度的两个或更多个OCS交换机中的每一个OCS交换机的OCS交换机路由表。在一些方面中,每一构建块可包括计算节点的三维环面或计算节点的网格中的一个。在一些方面中,超级平台包括多个工作量集群,且每一工作量集群包括构建块的不同子集,且执行与每个其它工作量集群不同的工作量。一些方面包括接收指示工作量集群的给定构建块已发生失效的数据,以及用可用构建块替换给定构建块。用可用构建块替换给定构建块可以包括更新所述光网络的一个或多个光路交换机的路由数据,以停止在所述工作量集群中的所述给定构建块与一个或多个其他构建块之间路由数据,以及更新所述光网络的所述一个或多个光路交换机的路由数据,以在所述工作量集群中的所述可用构建块与所述一个或多个其他构建块之间路由数据。在一些方面,计算节点的目标排列包括计算节点的n维排列,其中n大于或等于2。本说明书中描述的主题可以在特定实施例中实现,以便实现以下优点中的一个或多个。使用光网络为工作量动态配置计算节点的集群导致计算节点的较高可用性,因为其它计算节点可以容易地代替故障的或离线计算节点。可以从包括连接到光网络的计算节点的超级平台配置工作量集群。计算节点排列的灵活性导致计算节点的更高性能和更有效地分配针对每个工作量优化(或改进)的适当数量和排列的计算节点。利用包括使用光网络连接的多种类型的计算节点的超级平台,可以生成工作量集群,该工作量集群不仅包括适当数量和排列的计算节点,还包括用于每个工作量的适当类型的计算节点,例如,而不仅仅限于在数据中心或其它位置中彼此物理接近的计算节点。使用光网络为工作量配置工作量集群还为工作量提供了故障隔离和更好的安全性。例如,一些传统的超级计算机在组成超级计算机的各种计算机之间路由流量。如果其中一台计算机发生故障,该通信路径将丢失。使用光网络,数据可以被快速地重新路由和/或可用的计算节点可以替换(例如,代替)故障的计算节点。例如,通过重新配置光路交换(OCS)交换机,可以将超级平台中的另一个计算节点连接到工作量集群中的其它计算节点。此外,由OCS交换机提供的工作量之间的物理隔离(例如,不同光路径的物理隔离)与使用易受攻击的软件来管理分离相比,提供了在同一超级平台中执行的各种工作量之间的更好的安全性。相对于分组交换网络,使用光网络连接构建块还可以减少在构建块之间传输数据的等待时间。例如,在分组交换中,由于分组需要由交换机接收、缓冲和在另一个端口上再次发送,因此存在额外的等待时间。使用OCS交换机来连接构建本文档来自技高网...

【技术保护点】
1.一种使用具有一对多光交换机的光网络来重新配置超级平台的方法,其特征在于,所述方法包括:/n接收为计算工作量指定所请求的计算节点的请求数据,所述请求数据指定所述计算节点的目标排列;/n从包括一组构建块的超级平台中选择所述构建块的子集,所述一组构建块中的每个构建块包括m维度排列的计算节点,其中:/n每个构建块连接到光网络,所述光网络包括用于所述m维度中的每个维度的两个或更多个光路交换(OCS)交换机;/n对于所述m维度中的所述每个维度:/n每个构建块包括一段或多段沿着所述维度互连的计算节点,每个段包括在所述段的第一端上的第一计算节点和在所述段的与所述第一端相对的第二端上的第二计算节点;/n所述第一计算节点的第一部分连接到用于所述维度的所述两个或更多个OCS交换机中的第一OCS交换机;/n所述第一计算节点的一个或多个附加部分连接到用于所述维度的所述两个或更多个OCS交换机中的相应附加OCS交换机;和/n每个段的所述第二计算节点连接到相应的一对多光交换机的输入,所述一对多光交换机具有所述输入和多个输出,其中第一输出连接到所述第一OCS交换机,并且对于第一计算节点的每个附加部分,相应的附加输出连接到用于第一计算节点的附加部分的所述附加OCS交换机;/n确定与计算节点的所述目标排列相匹配的计算节点的所述子集的逻辑排列,针对所述m维度中的每个维度,所述逻辑排列限定每个构建块的所述段与一个或多个其它构建块的对应段之间的连接;/n生成计算节点的工作量集群,所述工作量集群包括所述构建块的所述子集,并且基于所述逻辑排列而彼此连接,所述生成包括:/n针对所述工作量集群的每个维度,为所述维度的所述两个或更多个OCS交换机中的每个OCS交换机配置相应的路由数据,所述工作量集群的每个维度的所述相应的路由数据指定所述计算工作量的数据如何沿着所述工作量集群的所述维度在计算节点之间被路由;和/n基于所述逻辑排列,配置所述一对多交换机的至少一部分,使得每段计算节点中的所述第二计算节点连接到与所述逻辑排列中所述第二计算节点所连接的对应段的对应第一计算节点相同的OCS交换机;和/n使所述工作量集群的所述计算节点执行所述计算工作量。/n...

【技术特征摘要】
20190701 US 16/458,9471.一种使用具有一对多光交换机的光网络来重新配置超级平台的方法,其特征在于,所述方法包括:
接收为计算工作量指定所请求的计算节点的请求数据,所述请求数据指定所述计算节点的目标排列;
从包括一组构建块的超级平台中选择所述构建块的子集,所述一组构建块中的每个构建块包括m维度排列的计算节点,其中:
每个构建块连接到光网络,所述光网络包括用于所述m维度中的每个维度的两个或更多个光路交换(OCS)交换机;
对于所述m维度中的所述每个维度:
每个构建块包括一段或多段沿着所述维度互连的计算节点,每个段包括在所述段的第一端上的第一计算节点和在所述段的与所述第一端相对的第二端上的第二计算节点;
所述第一计算节点的第一部分连接到用于所述维度的所述两个或更多个OCS交换机中的第一OCS交换机;
所述第一计算节点的一个或多个附加部分连接到用于所述维度的所述两个或更多个OCS交换机中的相应附加OCS交换机;和
每个段的所述第二计算节点连接到相应的一对多光交换机的输入,所述一对多光交换机具有所述输入和多个输出,其中第一输出连接到所述第一OCS交换机,并且对于第一计算节点的每个附加部分,相应的附加输出连接到用于第一计算节点的附加部分的所述附加OCS交换机;
确定与计算节点的所述目标排列相匹配的计算节点的所述子集的逻辑排列,针对所述m维度中的每个维度,所述逻辑排列限定每个构建块的所述段与一个或多个其它构建块的对应段之间的连接;
生成计算节点的工作量集群,所述工作量集群包括所述构建块的所述子集,并且基于所述逻辑排列而彼此连接,所述生成包括:
针对所述工作量集群的每个维度,为所述维度的所述两个或更多个OCS交换机中的每个OCS交换机配置相应的路由数据,所述工作量集群的每个维度的所述相应的路由数据指定所述计算工作量的数据如何沿着所述工作量集群的所述维度在计算节点之间被路由;和
基于所述逻辑排列,配置所述一对多交换机的至少一部分,使得每段计算节点中的所述第二计算节点连接到与所述逻辑排列中所述第二计算节点所连接的对应段的对应第一计算节点相同的OCS交换机;和
使所述工作量集群的所述计算节点执行所述计算工作量。


2.如权利要求1所述的方法,其特征在于,基于所述逻辑排列来配置所述一对多交换机的至少一部分、使得每段计算节点中的所述第二计算节点连接到与所述逻辑排列中所述第二计算节点所连接的对应段的对应第一计算节点相同的OCS交换机包括:
对于所述子集中的第一构建块,识别沿着特定维度与所述子集中与所述第一构建块相邻的第二构建块;
对于沿着所述特定维度的所述第一构建块的每一段:
识别所述第二构建块的对应段;
识别所述第二构建块的所述对应段的所述第一计算节点所连接的OCS交换机;和
配置所述段所连接的所述一对多交换机,以将所述段的所述第二计算节点连接到所识别的OCS交换机。


3.如权利要求2所述的方法,其特征在于,识别所述第二构建块的所述对应段包括识别所述第二构建块的段,所述第二构建块的所述段在所述逻辑排列中沿着所述特定维度、沿着与所述第一构建块的所述段相同的逻辑轴。


4.如权利要求1所述的方法,其特征在于,
所述第一计算节点的所述一个或多个附加部分是所述第一计算节点的一个附加部分;
所述一对多光交换机是具有一个输入和两个输出的一对二光交换机;和
所述第一计算节点的所述第一部分包括一半的所述第一计算节点,并且所述第一计算节点的所述附加部分包括一半的所述第一计算节点。


5.如权利要求1所述的方法,其特征在于,
所述请求数据指定不同类型的计算节点;和
选择构建块的所述子集包括针对由所述请求数据指定的每种类型的计算节点,选择包括指定类型的一个或多个计算节点的构建块。


6.如权利要求1所述的方法,其特征在于,所述超级平台的每个维度的相应路由数据包括用于所述维度的所述两个或更多个OCS交换机中的每一个OCS交换机的OCS交换机路由表。


7.如权利要求1所述的方法,其特征在于,每个构建块包括计算节点的三维环面或计算节点的网格中的一个。


8.如权利要求1所述的方法,其特征在于,所述超级平台包括多个工作量集群,并且其中,每个工作量集群包括所述构建块的不同子集、并且执行与每个其它工作量集群不同的工作量。


9.如权利要求1所述的方法,其特征在于,还包括:
接收指示所述工作量集群中的给定构建块已经失效的数据;和
用可用构建块来替换所述给定构建块。


10.如权利要求9所述的方法,其特征在于,用可用构建块替换所述给定构建块包括:
更新所述光网络的一个或多个光路交换机的路由数据,以停止在所述工作量集群中的所述给定构建块与一个或多个其他构建块之间路由数据;和
更新所述光网络的所述一个或多个光路交换机的路由数据,以在所述工作量集群中的所述可用构建块与所述一个或多个其他构建块之间路由数据。


11.如权利要求1所述的方法,其特征在于,所述计算节点的所述目标排列包括所述计算节点的n维排列,其中n大于或等于2。


12.一种使用具有一对多光交换机的光网络来重新配置超级平台的系统,其特征在于,包括:
光网络,所述光网络包括多个光路交换(OCS)交换机和多个一对多光交换机;和
一组构建块,每个所述构建块包括m维度排列的计算节点,其中:
每个所述构建块连接到所述光网络;
对于所述m维度中的每个维度:
每个构建块包括一段或多段沿着所述维度互连的计算节点,每个段包括在所述段的第一端上的第一计算节点和在所述段的与所述第一端相对的第二端上的第二计算节点;
所述第一计算节点的第一部分连接到用于所述维度的所述两个或更多个OCS交换机中的第一OCS交换机;
所述第一计算节...

【专利技术属性】
技术研发人员:耶利米·威尔库克
申请(专利权)人:谷歌有限责任公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1