一种基于胖树拓扑的数据中心网络链路恢复方法和装置制造方法及图纸

技术编号:41128181 阅读:20 留言:0更新日期:2024-04-30 17:56
本发明专利技术提供了一种基于胖树拓扑的数据中心网络链路恢复方法和装置,该方法包括:根据交换机入端口的路由请求,基于路由袁确定出端口,当所述出端口链路状态异常时,丢弃数据包,并将数据包中的DLID和SLID缓存到快速路由切换FRN发送队列中;从所述FRN发送队列中读取DLID中的备用端口字段,如果所述备用端口字段存在,则根据所述备用端口字段值修改路由表;如果所述备用端口字段不存在,则读取交换机在胖树拓扑中的层级值;当所述层级值不为零时,根据DLID和SLID组建FRN_MAD包,并传送到VHCA,以利用软件根据FRN_MAD包的DLID修改路由表。本发明专利技术的技术方案缩短了链路恢复时间。

【技术实现步骤摘要】

本专利技术属于高性能网络计算领域,特别涉及一种基于胖树拓扑的数据中心网络链路恢复方法和装置


技术介绍

1、高性能计算(hpc)一直被用于解决复杂计算问题。随着当前数据指数级增长的趋势,需要更大规模的集群计算规模来应对当前和未来的计算挑战。在hpc中,集群高效的进程间通信取决于能够提供高带宽和低延迟同时支持大量端点(计算和存储服务器)的互连结构,依赖于高速可靠的互连网络。mpi、共享存储、机器学习框架,甚至新的异构计算架构都具有相同的特性和要求,因此需要稳健而具有弹性的网络。

2、随着infiniband网络继续扩展以适应更大规模的计算和存储容量,未来可能需要40k网络节点,甚至100k节点来满足需求,但是随着hca卡和交换机的增加,特别是伴随这种情况不断增长的光纤线缆将会遭受物理或电气损坏,造成链路不通的情况。解决这个问题的传统软件机制包括作业检查,它将创建作业的时间点快照。如果作业在未来某个时间点失败,作业将从上次成功的状态和时间点继续。当然,ib协议也有数据完整性检查和重传机制,但这些方法对性能带来很大的负面影响,并且在非常大的规模下是不本文档来自技高网...

【技术保护点】

1.一种基于胖树拓扑的数据中心网络链路恢复方法,其特征在于,包括:

2.根据权利要求1所述的基于胖树拓扑的数据中心网络链路恢复方法,其特征在于,所述从所述FRN发送队列中读取DLID中的备用端口字段,进一步包括:

3.根据权利要求1所述的基于胖树拓扑的数据中心网络链路恢复方法,其特征在于,在所述读取交换机在胖树拓扑中的层级值之后,还包括:

4.根据权利要求1所述的基于胖树拓扑的数据中心网络链路恢复方法,其特征在于,所述根据DLID和SLID组建FRN_MAD包,进一步包括:

5.根据权利要求1所述的基于胖树拓扑的数据中心网络链路恢复方法,其...

【技术特征摘要】

1.一种基于胖树拓扑的数据中心网络链路恢复方法,其特征在于,包括:

2.根据权利要求1所述的基于胖树拓扑的数据中心网络链路恢复方法,其特征在于,所述从所述frn发送队列中读取dlid中的备用端口字段,进一步包括:

3.根据权利要求1所述的基于胖树拓扑的数据中心网络链路恢复方法,其特征在于,在所述读取交换机在胖树拓扑中的层级值之后,还包括:

4.根据权利要求1所述的基于胖树拓扑的数据中心网络链路恢复方法,其特征在于,所述根据dlid和slid组建frn_mad包,进一步包括:

5.根据权利要求1所述的基于胖树拓扑的数据中心网络链路恢复方法,其特征在于,所述...

【专利技术属性】
技术研发人员:熊绪斌郭二辉龚晓华程甜甜张瑞彪田义普沈薛权王飞付敏呼立展
申请(专利权)人:无锡众星微系统技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1