【技术实现步骤摘要】
本专利技术属于高性能网络计算领域,特别涉及一种基于胖树拓扑的数据中心网络链路恢复方法和装置。
技术介绍
1、高性能计算(hpc)一直被用于解决复杂计算问题。随着当前数据指数级增长的趋势,需要更大规模的集群计算规模来应对当前和未来的计算挑战。在hpc中,集群高效的进程间通信取决于能够提供高带宽和低延迟同时支持大量端点(计算和存储服务器)的互连结构,依赖于高速可靠的互连网络。mpi、共享存储、机器学习框架,甚至新的异构计算架构都具有相同的特性和要求,因此需要稳健而具有弹性的网络。
2、随着infiniband网络继续扩展以适应更大规模的计算和存储容量,未来可能需要40k网络节点,甚至100k节点来满足需求,但是随着hca卡和交换机的增加,特别是伴随这种情况不断增长的光纤线缆将会遭受物理或电气损坏,造成链路不通的情况。解决这个问题的传统软件机制包括作业检查,它将创建作业的时间点快照。如果作业在未来某个时间点失败,作业将从上次成功的状态和时间点继续。当然,ib协议也有数据完整性检查和重传机制,但这些方法对性能带来很大的负面影响,并且
...【技术保护点】
1.一种基于胖树拓扑的数据中心网络链路恢复方法,其特征在于,包括:
2.根据权利要求1所述的基于胖树拓扑的数据中心网络链路恢复方法,其特征在于,所述从所述FRN发送队列中读取DLID中的备用端口字段,进一步包括:
3.根据权利要求1所述的基于胖树拓扑的数据中心网络链路恢复方法,其特征在于,在所述读取交换机在胖树拓扑中的层级值之后,还包括:
4.根据权利要求1所述的基于胖树拓扑的数据中心网络链路恢复方法,其特征在于,所述根据DLID和SLID组建FRN_MAD包,进一步包括:
5.根据权利要求1所述的基于胖树拓扑的数据中心
...【技术特征摘要】
1.一种基于胖树拓扑的数据中心网络链路恢复方法,其特征在于,包括:
2.根据权利要求1所述的基于胖树拓扑的数据中心网络链路恢复方法,其特征在于,所述从所述frn发送队列中读取dlid中的备用端口字段,进一步包括:
3.根据权利要求1所述的基于胖树拓扑的数据中心网络链路恢复方法,其特征在于,在所述读取交换机在胖树拓扑中的层级值之后,还包括:
4.根据权利要求1所述的基于胖树拓扑的数据中心网络链路恢复方法,其特征在于,所述根据dlid和slid组建frn_mad包,进一步包括:
5.根据权利要求1所述的基于胖树拓扑的数据中心网络链路恢复方法,其特征在于,所述...
【专利技术属性】
技术研发人员:熊绪斌,郭二辉,龚晓华,程甜甜,张瑞彪,田义普,沈薛权,王飞,付敏,呼立展,
申请(专利权)人:无锡众星微系统技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。