System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于胖树拓扑的数据中心网络链路恢复方法和装置制造方法及图纸_技高网

一种基于胖树拓扑的数据中心网络链路恢复方法和装置制造方法及图纸

技术编号:41128181 阅读:4 留言:0更新日期:2024-04-30 17:56
本发明专利技术提供了一种基于胖树拓扑的数据中心网络链路恢复方法和装置,该方法包括:根据交换机入端口的路由请求,基于路由袁确定出端口,当所述出端口链路状态异常时,丢弃数据包,并将数据包中的DLID和SLID缓存到快速路由切换FRN发送队列中;从所述FRN发送队列中读取DLID中的备用端口字段,如果所述备用端口字段存在,则根据所述备用端口字段值修改路由表;如果所述备用端口字段不存在,则读取交换机在胖树拓扑中的层级值;当所述层级值不为零时,根据DLID和SLID组建FRN_MAD包,并传送到VHCA,以利用软件根据FRN_MAD包的DLID修改路由表。本发明专利技术的技术方案缩短了链路恢复时间。

【技术实现步骤摘要】

本专利技术属于高性能网络计算领域,特别涉及一种基于胖树拓扑的数据中心网络链路恢复方法和装置


技术介绍

1、高性能计算(hpc)一直被用于解决复杂计算问题。随着当前数据指数级增长的趋势,需要更大规模的集群计算规模来应对当前和未来的计算挑战。在hpc中,集群高效的进程间通信取决于能够提供高带宽和低延迟同时支持大量端点(计算和存储服务器)的互连结构,依赖于高速可靠的互连网络。mpi、共享存储、机器学习框架,甚至新的异构计算架构都具有相同的特性和要求,因此需要稳健而具有弹性的网络。

2、随着infiniband网络继续扩展以适应更大规模的计算和存储容量,未来可能需要40k网络节点,甚至100k节点来满足需求,但是随着hca卡和交换机的增加,特别是伴随这种情况不断增长的光纤线缆将会遭受物理或电气损坏,造成链路不通的情况。解决这个问题的传统软件机制包括作业检查,它将创建作业的时间点快照。如果作业在未来某个时间点失败,作业将从上次成功的状态和时间点继续。当然,ib协议也有数据完整性检查和重传机制,但这些方法对性能带来很大的负面影响,并且在非常大的规模下是不切实际的。

3、在实验中,我们在280个节点组成两层胖树的小规模ndr环境中进行15天压测。ndr线缆(线缆1)每小时的发生异常概率为0.0232%。1根线缆,使用5.6个月,大概会出现1次。10000根线缆,1个小时会有2.32根线缆出现异常。在乌镇中心的hdr环境下,1402条光纤线缆,7天时间发生了3次类似事件,每小时的发生异常概率为0.00129%。通过简单的计算,按照测试得到的异常概率来计算,10k、40k、100k节点规模下2小时发生线缆故障的次数如表1所示。

4、表1

5、

6、可以看出,在大规模环境中出现链路错误的问题是比较常见的,无论是线缆1还是线缆2在更大规模的环境中出现故障的次数和概率都比较大,所以需要更加稳定的光纤链路,更加快速有效的链路容错算法。

7、但是在当今的高速网络中,如果出现链路故障的情况,节点会向子网管理器opensm发送trap128的管理包(mad),opensm收到mad包后将识别故障链路,触发重新扫描并重新计算路由以避免问题,但是对于1000个节点,这可能需要长达5秒的时间;对于具有10000个或更多节点的群集,这可能需要30秒甚至更长的时间,这将无法确保运行计算的完整性。低效的处理机制会导致较长的链路恢复时间,这将无法保证网络的可靠稳定,很可能会导致作业失败,这是无法容忍的情况。因此急需一种高效快速的路由容错方法。


技术实现思路

1、本专利技术的目的在于提供一种基于胖树拓扑的数据中心网络链路恢复方法和装置,旨在缩短链路恢复时间。

2、根据本专利技术的第一方面,提供了一种基于胖树拓扑的数据中心网络链路恢复方法,包括:

3、根据交换机入端口的路由请求,基于路由表确定出端口,当所述出端口链路状态异常时,丢弃数据包,并将数据包中的dlid和slid缓存到frn发送队列中;

4、从所述frn发送队列中读取dlid中的备用端口字段,如果所述备用端口字段存在,则根据所述备用端口字段值修改路由表;如果所述备用端口字段不存在,则读取交换机在胖树拓扑中的层级值;

5、当所述层级值不为零时,根据dlid和slid组建frn_mad包,并传送到vhca,以利用软件根据frn_mad包的dlid修改路由表。

6、优选地,所述从所述frn发送队列中读取dlid中的备用端口字段,进一步包括:

7、当所述frn发送队列中存储的dlid和slid超过预设阈值时,向cpu发起中断;cpu收到中断后,获取所述frn发送队列,解析出dlid中的备用端口字段。

8、优选地,在所述读取交换机在胖树拓扑中的层级值之后,还包括:

9、当所述层级值为零时,不执行任何处理。

10、优选地,所述根据dlid和slid组建frn_mad包,进一步包括:

11、将frn_mad包的slid设置为所述交换机的lid,将frn_mad包的dlid设置为所述数据包的slid,将frn_mad包的payload填充以对应数据包的dlid。

12、优选地,所述组建frn_mad包并传送到vhca,进一步包括:

13、当frn_mad包到达胖树拓扑的每一级交换机后,如果层级值不为零,则直接转发所述frn_mad包,如果层级值为零,则将该包传送到vhca。

14、根据本专利技术的第二方面,提供了一种基于胖树拓扑的数据中心网络链路恢复装置,包括:

15、中断单元,用于根据交换机入端口的路由请求,基于路由表确定出端口,当所述出端口链路状态异常时,丢弃数据包,并将数据包中的dlid和slid缓存到frn发送队列中;

16、判断单元,用于从所述frn发送队列中读取dlid中的备用端口字段,如果所述备用端口字段存在,则根据所述备用端口字段值修改路由表;如果所述备用端口字段不存在,则读取交换机在胖树拓扑中的层级值;

17、组包单元,用于在所述层级值不为零时,根据dlid和slid组建frn_mad包,并传送到vhca,以利用软件根据frn_mad包的dlid修改路由表。

18、相比于相关技术,本专利技术的技术方案具备以下优点:

19、本专利技术的链路切换直接在交换机中进行,缩短了链路恢复时间,保证运行计算的完整性,能够实现链路故障的快速识别和快速恢复。

20、本专利技术的其它特征和优点将在随后的说明书中阐述,并且部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点可以通过在说明书、权利要求书以及附图中所指出的结构和流程来实现和获取。

本文档来自技高网...

【技术保护点】

1.一种基于胖树拓扑的数据中心网络链路恢复方法,其特征在于,包括:

2.根据权利要求1所述的基于胖树拓扑的数据中心网络链路恢复方法,其特征在于,所述从所述FRN发送队列中读取DLID中的备用端口字段,进一步包括:

3.根据权利要求1所述的基于胖树拓扑的数据中心网络链路恢复方法,其特征在于,在所述读取交换机在胖树拓扑中的层级值之后,还包括:

4.根据权利要求1所述的基于胖树拓扑的数据中心网络链路恢复方法,其特征在于,所述根据DLID和SLID组建FRN_MAD包,进一步包括:

5.根据权利要求1所述的基于胖树拓扑的数据中心网络链路恢复方法,其特征在于,所述组建FRN_MAD包并传送到内部管理节点VHCA,进一步包括:

6.一种基于胖树拓扑的数据中心网络链路恢复装置,其特征在于,包括:

7.根据权利要求6所述的基于胖树拓扑的数据中心网络链路恢复装置,其特征在于,所述判断单元,进一步用于:

8.根据权利要求6所述的基于胖树拓扑的数据中心网络链路恢复装置,其特征在于,所述判断单元,进一步用于:

>9.根据权利要求6所述的基于胖树拓扑的数据中心网络链路恢复装置,其特征在于,所述组包单元,进一步用于:

10.根据权利要求6所述的基于胖树拓扑的数据中心网络链路恢复装置,其特征在于,所述组包单元,进一步用于:

...

【技术特征摘要】

1.一种基于胖树拓扑的数据中心网络链路恢复方法,其特征在于,包括:

2.根据权利要求1所述的基于胖树拓扑的数据中心网络链路恢复方法,其特征在于,所述从所述frn发送队列中读取dlid中的备用端口字段,进一步包括:

3.根据权利要求1所述的基于胖树拓扑的数据中心网络链路恢复方法,其特征在于,在所述读取交换机在胖树拓扑中的层级值之后,还包括:

4.根据权利要求1所述的基于胖树拓扑的数据中心网络链路恢复方法,其特征在于,所述根据dlid和slid组建frn_mad包,进一步包括:

5.根据权利要求1所述的基于胖树拓扑的数据中心网络链路恢复方法,其特征在于,所述...

【专利技术属性】
技术研发人员:熊绪斌郭二辉龚晓华程甜甜张瑞彪田义普沈薛权王飞付敏呼立展
申请(专利权)人:无锡众星微系统技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1