System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种RoCE网络指定流PFC死锁预防方法、设备及介质技术_技高网

一种RoCE网络指定流PFC死锁预防方法、设备及介质技术

技术编号:40236410 阅读:6 留言:0更新日期:2024-02-02 22:36
本申请实施例公开了一种RoCE网络指定流PFC死锁预防方法、设备及介质。方法由预置SDN控制器执行,包括,获取被纳管的交换机的管理信息;基于管理信息,创建PFC保障流量条目与PFC保障规则,并将PFC保障流量条目与PFC保障规则进行绑定;在当前RoCE网络中存在PFC保障流量条目中的特定流量的情况下,基于特定流量端口的缓存情况对特定流量的死锁预防情况进行确定;在确定当前RoCE网络中的特定流量存在死锁预防情况时,基于交换机的设备信息,将PFC保障规则下发至特定流量对应的交换机,使特定流量进行队列切换,以实现死锁预防。通过上述方法,使得特定流量在可能出现死锁问题的场景下进行传递。

【技术实现步骤摘要】

本申请涉及数据传输,尤其涉及一种roce网络指定流pfc死锁预防方法、设备及介质。


技术介绍

1、随着近年来网络技术的不断进步,数据中心内存储网络不再局限于使用网状信道(fibre channel)或其他ip-san方式传输存储业务,roce(rdmaover converged ethernet)技术拥有的零复制、高效传输、节省成本等特性,很快成为了数据中心内一种主流的存储业务承载方式。

2、roce为存储业务提供了无损网络基础,并解决了原本tcp方式存在的延迟及cpu消耗等问题。为实现上述特性,roce使用了基于优先级的流量控制pfc(priority-based flowcontrol)进行2层网络流量控制,通过让交换机在端口缓存溢出发生之前,暂停其直接上游设备来避免数据包丢失。

3、然而,pfc在某些特殊场景下,存在死锁(deadlock)问题。由于环路或其他原因,多台交换机同时发生拥塞,每台交换机的接口缓存区使用率超过阈值,交换机相互等待释放资源,所有交换机上的数据流因此永久封锁。

4、如何在死锁现象发生前进行预防,保障特定流量能在可能出现死锁问题的场景下仍正常传递,成为了数据中心中关于roce网络亟待解决的问题。


技术实现思路

1、本申请实施例提供了一种roce网络指定流pfc死锁预防方法、设备及介质,用于解决如下技术问题:pfc在某些特殊场景下,存在死锁问题,使得特定流量难以在可能出现死锁问题的场景下进行传递。

2、本申请实施例采用下述技术方案:

3、本申请实施例提供一种roce网络指定流pfc死锁预防方法。包括,获取被纳管的交换机的管理信息;基于管理信息,创建pfc保障流量条目与pfc保障规则,并将pfc保障流量条目与pfc保障规则进行绑定;其中,pfc保障流量条目中包括有多种死锁预防的特定流量信息,pfc保障规则中包括有多种pfc队列切换信息;在当前roce网络中存在pfc保障流量条目中的特定流量的情况下,基于特定流量端口的缓存情况对特定流量的死锁预防情况进行确定;在确定当前roce网络中的特定流量存在死锁预防情况时,基于交换机的设备信息,将pfc保障规则下发至特定流量对应的交换机,使特定流量进行队列切换,以实现死锁预防。

4、本申请实施例通过部署了sdn控制器的数据中心,能够使roce业务在死锁现象发生前进行预防。通过创建的pfc保障流量条目与pfc保障规则,对特定流量进行队列切换,保障特定流量能在可能出现死锁问题的场景下仍正常传递,降低了roce使用pfc进行流量控制带来的风险。此外,通过对死锁现象进行监测预防,保障了指定业务流稳定性,配合sdn控制器roce指定流量监控功能,节约了运维产生的人力成本。

5、在本申请的一种实现方式中,获取被纳管的交换机的设备信息之前,方法还包括:基于需要被sdn控制器管理的交换机对应的地址与管理信息,进行物理链路与管理网络搭建;对需要被纳管的交换机进行初始化配置,并通过预置网络协议与需要被纳管的交换机进行连接;将需要被sdn控制器管理的交换机对应的管理信息保存至预置数据库。

6、在本申请的一种实现方式中,将需要被sdn控制器管理的交换机对应的管理信息保存至预置数据库,具体包括:获取需要被纳管的交换机对应的管理信息;其中,管理信息至少包括管理网络ip、管理用户名与密码以及snmp相关配置中的一项;通过ssh协议和/或snmp协议对管理信息进行验证,并在验证通过的情况下,将管理信息保存至预置数据库。

7、在本申请的一种实现方式中,基于特定流量端口的缓存情况对特定流量的死锁情况进行确定,具体包括:通过ssh协议和/或snmp协议与纳管成功的交换机进行连接;周期性获取被纳管的交换机分别对应的设备信息;其中,设备信息至少包括设备配置、设备状态信息以及设备端口流量中的一项;在roce流量通过队列发送的情况下,根据交换机内roce队列统计数据,获取各设备端口信息,以通过设备端口信息对死锁预防情况进行确定;其中,端口信息至少包括各队列长度、端口缓存以及pfc收发信息数量中的一项。

8、在本申请的一种实现方式中,通过设备端口信息对死锁预防情况进行确定,具体包括:确定特定流量对应的参考交换机;确定出参考交换机与spine互连的第一端口;以及确定出参考交换机与leaf互联的第二端口;在第一端口与第二端口分别对应的相反方向流量内,同时存在源目的ip相同的流量的情况下,确定当前组网存在死锁预防情况。

9、在本申请的一种实现方式中,将pfc保障规则下发至特定流量对应的交换机,使特定流量进行队列切换,以实现死锁预防,具体包括:基于pfc保障规则,将特定流量切换至相应切换范围内优先级最高的队列;对特定流量进行实时监控,若特定流量仍存在死锁预防情况,则将特定流量切换至pfc保障规则所对应的次优先级队列,直到特定流量不存在死锁预防情况。

10、在本申请的一种实现方式中,将pfc保障规则下发至特定流量对应的交换机,使特定流量进行队列切换之后,方法还包括:在pfc保障规则对应的所有队列切换用尽后,若仍存在死锁预防情况,则将指定流量切换至预置队列0,并发出警告信息;其中,预置队列0为有损队列。

11、在本申请的一种实现方式中,基于管理信息,创建pfc保障流量条目与pfc保障规则,具体包括:基于管理信息,获取多种特定流量分别对应的发送端源ip与目的端目的ip;以及获取多种特定流量发送时,基于当前业务需求,为多种特定流量分别分配的队列信息;在sdn控制器前端界面,将发送端源ip、目的端目的ip以及队列信息进行上传,以完成pfc保障流量条目创建;获取不同特定流量分别对应的pfc队列切换范围,并确定出每个队列分别对应的pfc切换优先级顺序,以基于pfc队列切换范围与pfc切换优先级顺序创建pfc保障规则。

12、本申请实施例提供一种roce网络指定流pfc死锁预防设备,包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够:获取被纳管的交换机的管理信息;基于所述管理信息,创建pfc保障流量条目与pfc保障规则,并将pfc保障流量条目与pfc保障规则进行绑定;其中,pfc保障流量条目中包括有多种死锁预防的特定流量信息,pfc保障规则中包括有多种pfc队列切换信息;在当前roce网络中存在pfc保障流量条目中的特定流量的情况下,基于特定流量端口的缓存情况对特定流量的死锁预防情况进行确定;在确定当前roce网络中的特定流量存在死锁预防情况时,基于交换机的设备信息,将pfc保障规则下发至特定流量对应的交换机,使特定流量进行队列切换,以实现死锁预防。

13、本申请实施例提供的一种非易失性计算机存储介质,存储有计算机可执行指令,计算机可执行指令设置为:获取被纳管的交换机的管理信息;基于所述管理信息,创建pfc保障流量条目与pfc保障规则本文档来自技高网...

【技术保护点】

1.一种RoCE网络指定流PFC死锁预防方法,所述方法由预置SDN控制器执行,其特征在于,所述方法包括:

2.根据权利要求1所述的一种RoCE网络指定流PFC死锁预防方法,其特征在于,所述获取被纳管的交换机的设备信息之前,所述方法还包括:

3.根据权利要求2所述的一种RoCE网络指定流PFC死锁预防方法,其特征在于,所述将所述需要被SDN控制器管理的交换机的对应管理信息保存至预置数据库,具体包括:

4.根据权利要求1所述的一种RoCE网络指定流PFC死锁预防方法,其特征在于,所述基于所述特定流量端口的缓存情况对所述特定流量的死锁情况进行确定,具体包括:

5.根据权利要求4所述的一种RoCE网络指定流PFC死锁预防方法,其特征在于,所述通过所述设备端口信息对所述死锁预防情况进行确定,具体包括:

6.根据权利要求1所述的一种RoCE网络指定流PFC死锁预防方法,其特征在于,所述将所述PFC保障规则下发至所述特定流量对应的交换机,使所述特定流量进行队列切换,以实现死锁预防,具体包括:

7.根据权利要求1所述的一种RoCE网络指定流PFC死锁预防方法,其特征在于,所述将所述PFC保障规则下发至所述特定流量对应的交换机,使所述特定流量进行队列切换之后,所述方法还包括:

8.根据权利要求1所述的一种RoCE网络指定流PFC死锁预防方法,其特征在于,所述基于所述管理信息,创建PFC保障流量条目与PFC保障规则,具体包括:

9.一种RoCE网络指定流PFC死锁预防设备,包括:

10.一种非易失性计算机存储介质,存储有计算机可执行指令,所述计算机可执行指令设置为:

...

【技术特征摘要】

1.一种roce网络指定流pfc死锁预防方法,所述方法由预置sdn控制器执行,其特征在于,所述方法包括:

2.根据权利要求1所述的一种roce网络指定流pfc死锁预防方法,其特征在于,所述获取被纳管的交换机的设备信息之前,所述方法还包括:

3.根据权利要求2所述的一种roce网络指定流pfc死锁预防方法,其特征在于,所述将所述需要被sdn控制器管理的交换机的对应管理信息保存至预置数据库,具体包括:

4.根据权利要求1所述的一种roce网络指定流pfc死锁预防方法,其特征在于,所述基于所述特定流量端口的缓存情况对所述特定流量的死锁情况进行确定,具体包括:

5.根据权利要求4所述的一种roce网络指定流pfc死锁预防方法,其特征在于,所述通过所述设备端口信息对所述死锁预防情况进行确定,...

【专利技术属性】
技术研发人员:丁宇桐王生银
申请(专利权)人:浪潮思科网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1