【技术实现步骤摘要】
使用具有一对多光交换机的光网络的可重新配置的计算平台
技术介绍
一些计算工作量(例如机器学习训练)需要大量的处理节点来有效地完成工作量。处理节点可以通过互连网络彼此通信。例如,在机器学习训练中,处理节点可以相互通信以收敛于最优的深度学习模型。互连网络对于处理单元实现收敛的速度和效率是关键的。由于机器学习和其它工作工作量在尺寸和复杂性上变化,包括多个处理节点的超级计算机的刚性结构可以限制超级计算机的可用性、可伸缩性和性能。例如,如果具有连接特定处理节点排列的刚性互连网络的超级计算机的一些处理节点发生故障,则超级计算机可能不能替换这些处理节点,从而导致可用性和性能降低。一些特定的排列也可以导致比其它排列更高的性能,而与故障节点无关。
技术实现思路
本说明书描述了涉及可重新配置的计算节点的超级平台(superpod)的技术,使用光网络从超级平台生成工作量集群。通常,本说明书中描述的主题的一个创新方面可以体现在包括接收指定计算工作量的所请求的计算节点的请求数据的方法中。请求数据指定计算节点的目标排列。从包括一组构建块的超级平台中选择所述构建块的子集,所述一组构建块中的每个构建块包括m维度排列的计算节点。每个构建块连接到光网络,该光网络包括用于m维中的每一维的两个或更多个光路交换(OCS)交换机。对于m个维度中的每个维度,每个构建块包括一段或多段沿着维度互连的计算节点。每个段包括在所述段的第一端上的第一计算节点和在所述段的与所述第一端相对的第二端上的第二计算节点。对于m维中的每一维,第一计算节点的第一部分连接到用于该维的两个或更 ...
【技术保护点】
1.一种使用具有一对多光交换机的光网络来重新配置超级平台的方法,其特征在于,所述方法包括:/n接收为计算工作量指定所请求的计算节点的请求数据,所述请求数据指定所述计算节点的目标排列;/n从包括一组构建块的超级平台中选择所述构建块的子集,所述一组构建块中的每个构建块包括m维度排列的计算节点,其中:/n每个构建块连接到光网络,所述光网络包括用于所述m维度中的每个维度的两个或更多个光路交换(OCS)交换机;/n对于所述m维度中的所述每个维度:/n每个构建块包括一段或多段沿着所述维度互连的计算节点,每个段包括在所述段的第一端上的第一计算节点和在所述段的与所述第一端相对的第二端上的第二计算节点;/n所述第一计算节点的第一部分连接到用于所述维度的所述两个或更多个OCS交换机中的第一OCS交换机;/n所述第一计算节点的一个或多个附加部分连接到用于所述维度的所述两个或更多个OCS交换机中的相应附加OCS交换机;和/n每个段的所述第二计算节点连接到相应的一对多光交换机的输入,所述一对多光交换机具有所述输入和多个输出,其中第一输出连接到所述第一OCS交换机,并且对于第一计算节点的每个附加部分,相应的附加输 ...
【技术特征摘要】
20190701 US 16/458,9471.一种使用具有一对多光交换机的光网络来重新配置超级平台的方法,其特征在于,所述方法包括:
接收为计算工作量指定所请求的计算节点的请求数据,所述请求数据指定所述计算节点的目标排列;
从包括一组构建块的超级平台中选择所述构建块的子集,所述一组构建块中的每个构建块包括m维度排列的计算节点,其中:
每个构建块连接到光网络,所述光网络包括用于所述m维度中的每个维度的两个或更多个光路交换(OCS)交换机;
对于所述m维度中的所述每个维度:
每个构建块包括一段或多段沿着所述维度互连的计算节点,每个段包括在所述段的第一端上的第一计算节点和在所述段的与所述第一端相对的第二端上的第二计算节点;
所述第一计算节点的第一部分连接到用于所述维度的所述两个或更多个OCS交换机中的第一OCS交换机;
所述第一计算节点的一个或多个附加部分连接到用于所述维度的所述两个或更多个OCS交换机中的相应附加OCS交换机;和
每个段的所述第二计算节点连接到相应的一对多光交换机的输入,所述一对多光交换机具有所述输入和多个输出,其中第一输出连接到所述第一OCS交换机,并且对于第一计算节点的每个附加部分,相应的附加输出连接到用于第一计算节点的附加部分的所述附加OCS交换机;
确定与计算节点的所述目标排列相匹配的计算节点的所述子集的逻辑排列,针对所述m维度中的每个维度,所述逻辑排列限定每个构建块的所述段与一个或多个其它构建块的对应段之间的连接;
生成计算节点的工作量集群,所述工作量集群包括所述构建块的所述子集,并且基于所述逻辑排列而彼此连接,所述生成包括:
针对所述工作量集群的每个维度,为所述维度的所述两个或更多个OCS交换机中的每个OCS交换机配置相应的路由数据,所述工作量集群的每个维度的所述相应的路由数据指定所述计算工作量的数据如何沿着所述工作量集群的所述维度在计算节点之间被路由;和
基于所述逻辑排列,配置所述一对多交换机的至少一部分,使得每段计算节点中的所述第二计算节点连接到与所述逻辑排列中所述第二计算节点所连接的对应段的对应第一计算节点相同的OCS交换机;和
使所述工作量集群的所述计算节点执行所述计算工作量。
2.如权利要求1所述的方法,其特征在于,基于所述逻辑排列来配置所述一对多交换机的至少一部分、使得每段计算节点中的所述第二计算节点连接到与所述逻辑排列中所述第二计算节点所连接的对应段的对应第一计算节点相同的OCS交换机包括:
对于所述子集中的第一构建块,识别沿着特定维度与所述子集中与所述第一构建块相邻的第二构建块;
对于沿着所述特定维度的所述第一构建块的每一段:
识别所述第二构建块的对应段;
识别所述第二构建块的所述对应段的所述第一计算节点所连接的OCS交换机;和
配置所述段所连接的所述一对多交换机,以将所述段的所述第二计算节点连接到所识别的OCS交换机。
3.如权利要求2所述的方法,其特征在于,识别所述第二构建块的所述对应段包括识别所述第二构建块的段,所述第二构建块的所述段在所述逻辑排列中沿着所述特定维度、沿着与所述第一构建块的所述段相同的逻辑轴。
4.如权利要求1所述的方法,其特征在于,
所述第一计算节点的所述一个或多个附加部分是所述第一计算节点的一个附加部分;
所述一对多光交换机是具有一个输入和两个输出的一对二光交换机;和
所述第一计算节点的所述第一部分包括一半的所述第一计算节点,并且所述第一计算节点的所述附加部分包括一半的所述第一计算节点。
5.如权利要求1所述的方法,其特征在于,
所述请求数据指定不同类型的计算节点;和
选择构建块的所述子集包括针对由所述请求数据指定的每种类型的计算节点,选择包括指定类型的一个或多个计算节点的构建块。
6.如权利要求1所述的方法,其特征在于,所述超级平台的每个维度的相应路由数据包括用于所述维度的所述两个或更多个OCS交换机中的每一个OCS交换机的OCS交换机路由表。
7.如权利要求1所述的方法,其特征在于,每个构建块包括计算节点的三维环面或计算节点的网格中的一个。
8.如权利要求1所述的方法,其特征在于,所述超级平台包括多个工作量集群,并且其中,每个工作量集群包括所述构建块的不同子集、并且执行与每个其它工作量集群不同的工作量。
9.如权利要求1所述的方法,其特征在于,还包括:
接收指示所述工作量集群中的给定构建块已经失效的数据;和
用可用构建块来替换所述给定构建块。
10.如权利要求9所述的方法,其特征在于,用可用构建块替换所述给定构建块包括:
更新所述光网络的一个或多个光路交换机的路由数据,以停止在所述工作量集群中的所述给定构建块与一个或多个其他构建块之间路由数据;和
更新所述光网络的所述一个或多个光路交换机的路由数据,以在所述工作量集群中的所述可用构建块与所述一个或多个其他构建块之间路由数据。
11.如权利要求1所述的方法,其特征在于,所述计算节点的所述目标排列包括所述计算节点的n维排列,其中n大于或等于2。
12.一种使用具有一对多光交换机的光网络来重新配置超级平台的系统,其特征在于,包括:
光网络,所述光网络包括多个光路交换(OCS)交换机和多个一对多光交换机;和
一组构建块,每个所述构建块包括m维度排列的计算节点,其中:
每个所述构建块连接到所述光网络;
对于所述m维度中的每个维度:
每个构建块包括一段或多段沿着所述维度互连的计算节点,每个段包括在所述段的第一端上的第一计算节点和在所述段的与所述第一端相对的第二端上的第二计算节点;
所述第一计算节点的第一部分连接到用于所述维度的所述两个或更多个OCS交换机中的第一OCS交换机;
所述第一计算节...
【专利技术属性】
技术研发人员:耶利米·威尔库克,
申请(专利权)人:谷歌有限责任公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。