一种堆叠系统故障处理方法以及设备技术方案

技术编号:19828403 阅读:45 留言:0更新日期:2018-12-19 16:57
本发明专利技术实施例提供一种堆叠系统故障处理方法以及设备,涉及通信技术领域,用于在堆叠系统的成员设备的交换矩阵板卡故障时,减小对堆叠系统的影响。该方法包括:接收堆叠系统的从属设备发送的第一通知报文,第一通知报文用于指示发送第一通知报文的从属设备的交换矩阵板卡发生故障;向堆叠系统的所有从属设备发送第二通知报文;第二通知报文用于指示堆叠系统的所有从属设备将发送第一通知报文的从属设备的软件状态设置为异常状态,并计算获取目标单播转发路径,目标单播转发路径中不包含发送第一通知报文的从属设备。本发明专利技术实施例用于堆叠系统的故障处理。

【技术实现步骤摘要】
一种堆叠系统故障处理方法以及设备
本专利技术涉及通信
,尤其涉及一种堆叠系统故障处理方法以及设备。
技术介绍
堆叠技术是通过堆叠链路连接将多台物理设备连接在一起组成堆叠系统(StackingSystem,SS),并从组成堆叠系统的多台物理设备中选择一台物理设备作为主控设备(Master),从而对多台物理设备的管理面以及数据面进行统一管理的技术。其中,组成堆叠系统的多个物理设备统称为堆叠系统的成员设备;选择出对各成员设备进行统一管理的成员设备称为堆叠系统的主控设备,其他成员设备称为堆叠系统的从属设备(Slave)。一个成员设备可能包括多张业务板卡(LPU),且多张LPU之间通过交换矩阵板卡(SFU)进行流量转发。在堆叠系统中,当某个成员设备的交换矩阵板卡发生故障时,堆叠系统中其他成员设备无法感知,因此堆叠系统内部的控制面管理信息以及数据面数据信息仍会按照原路径传输,而这会导致堆叠系统中的控制面和数据面异常,进而导致网络故障。现有技术中,当堆叠系统的某一设备的交换矩阵板卡发生故障时的处理方案为:需要人工感知故障设备位置,并将故障设备切换为单机模式或者将故障设备退出堆叠系统。然而,在堆叠系统中若将故障设备切换为单机模式或者将故障设备退出堆叠系统,对堆叠系统影响较大,甚至可能会导致堆叠系统出现分裂等异常,特别是链式堆叠环境下的堆叠系统,将故障设备切换为单机模式或者将故障设备退出堆叠系统,则会直接导致堆叠系统出现分裂。同时由于需要人为查找故障点,效率及故障恢复时间也较长,因此感知且处理堆叠系统的成员设备的交换矩阵板卡故障,减小对堆叠系统的影响是一个亟待解决的问题。
技术实现思路
本专利技术的实施例提供一种堆叠系统故障处理方法以及设备,用于在堆叠系统的成员设备的交换矩阵板卡故障时,减小对堆叠系统的影响。为达到上述目的,本专利技术的实施例采用如下技术方案:第一方面,本专利技术实施例提供了一种堆叠系统故障处理方法,应用于堆叠系统的主控设备,所述方法包括:接收所述堆叠系统的从属设备发送的第一通知报文,所述第一通知报文用于指示发送所述第一通知报文的从属设备的交换矩阵板卡发生故障;向所述堆叠系统的所有从属设备发送第二通知报文;所述第二通知报文用于指示堆叠系统的所有从属设备将发送所述第一通知报文的从属设备的软件状态设置为异常状态,并计算获取目标单播转发路径,所述目标单播转发路径中不包含发送所述第一通知报文的从属设备。可选的,若所述堆叠系统为非链形堆叠系统,则在接收到从属设备发送的第一通知报文之后,所述方法还包括:获取第一广播转发路径,所述第一广播转发路径中发送所述第一通知报文的从属设备为广播断环点;向所述堆叠系统的所有从属设备发送所述第一广播转发路径,所述广播转发路径用于指示所述堆叠系统的所有从属设备将根据所述广播转发路径对广播形式的报文进行转发。可选的,在接收到从属设备发送的第一通知报文之后,所述方法还包括:禁止开启发送所述第一通知报文的从属设备的业务板卡的业务端口。可选的,所述方法还包括:接收发送所述第一通知报文的从属设备发送的第三通知报文,所述第三通知报文用于指示发送所述第一通知报文的从属设备的交换矩阵板卡的故障已恢复;向所述堆叠系统的所有从属设备发送第四通知报文;所述第四通知报文用于指示堆叠系统的所有从属设备将发送所述第一通知报文的从属设备的软件状态设置为正常状态,并重新计算单播转发路径。第二方面,本专利技术的实施例提供一种堆叠系统故障处理方法,应用于堆叠系统的从属设备,所述方法包括:检测本设备的交换矩阵板卡是否发生故障;若确定交换矩阵板卡发生故障,则关闭本设备的所有业务板卡上的业务端口,并向所述堆叠系统的主控设备发送第一通知报文;所述第一通知报文用于指示本设备的交换矩阵板卡发生故障。可选的,若所述堆叠系统为非链形堆叠系统,则在向所述堆叠系统的主控设备发送第一通知报文之后,所述方法还包括:接收所述主控设备发送的第一广播转发路径,所述第一广播转发路径中所述从属设备为广播断环点;根据所述第一广播转发路径禁止对广播形式的报文进行转发。可选的,所述方法还包括:确定设备的堆叠端口是否设置在多张业务板卡上;若是,则确定是否存在目标业务板卡,所述目标业务板卡为堆叠端口直连的对端成员设备包括本设备的所有直连成员设备的业务板卡;若仅存在一张目标业务板卡,则关闭本设备上除所述目标业务板卡以外其他业务板卡上的堆叠端口;若存在多张目标业务板卡,则根据第一预设规则在所述多张目标业务板卡中选取第一业务板卡,并关闭所述本设备上除所述第一业务板卡以外其他业务板卡上的堆叠端口;若不存在目标业务板卡,则根据第二预设规则在所述本设备的业务板卡中选取目标业务板卡集合,并关闭所述本设备上除所述目标业务板卡集合中的业务板卡以外其他业务板卡上的堆叠端口;所述目标业务板卡集合中的业务板卡的堆叠端口的对端成员设备的合集包括所述本设备的所有直连成员设备。可选的,所述方法还包括:当确定交换矩阵板卡的故障修复之后,向所述主控设备发送第三通知报文并开启所有业务板卡的所有端口;所述第三通知报文用于指示所述本设备的交换矩阵板卡的故障已恢复。第三方面,本专利技术的实施例提供一种堆叠系统故障处理方法,应用于堆叠系统的从属设备,所述方法包括:接收所述堆叠系统的主控设备在接收到第一通知报文后发出的第二通知报文,所述第一通知报文用于指示发送所述第一通知报文的从属设备的交换矩阵板卡发生故障,所述第二通知报文用于指示本设备将发送所述第一通知报文的从属设备的软件状态设置为异常状态,并计算获取目标单播转发路径,所述目标单播转发路径中不包含发送所述第一通知报文的从属设备。可选的,当所述堆叠系统为非链式堆叠系统,所述计算获取目标单播转发路径包括:在本设备到所述目的设备的路径中选取不经过发送所述第一通知报文的从属设备的路径作为所述单播转发路径。第四方面,本专利技术的实施例提供一种堆叠系统的主控设备,包括:接收单元,接收所述堆叠系统的从属设备发送的第一通知报文,所述第一通知报文用于指示所述从属设备的交换矩阵板卡发生故障;发送单元,用于向所述堆叠系统的所有从属设备发送第二通知报文;所述第二通知报文用于指示堆叠系统的所有从属设备将发送所述第一通知报文的从属设备的软件状态设置为异常状态,并计算获取目标单播转发路径,所述目标单播转发路径中不包含所述从属设备。可选的,所述主控设备还包括:获取单元;若所述堆叠系统为非链形堆叠系统,则所述获取单元,用于在所述接收单元接收到所述第一通知报文之后,获取第一广播转发路径,所述第一广播转发路径中发送所述第一通知报文的从属设备为广播断环点;所述发送单元,还用于向所述堆叠系统的所有从属设备发送所述第一广播转发路径,所述第一广播转发路径用于指示所述堆叠系统的所有从属设备将根据所述第一广播转发路径对广播形式的报文进行转发。可选的,所述主控设备还包括:处理单元;所述处理单元,用于在所述接收单元接收到所述第一通知报文之后,禁止开启发送所述第一通知报文的从属设备的业务板卡的业务端口。可选的,所述接收单元,还用于接收发送所述第一通知报文的从属设备发送的第三通知报文,所述第三通知报文用于指示所述从属设备的交换矩阵板卡的故障已恢复;所述发送单元,还用于向所述堆叠系统的所有从属设备发送第四通知报文;所述第四通本文档来自技高网
...

【技术保护点】
1.一种堆叠系统故障处理方法,其特征在于,应用于堆叠系统的主控设备,所述方法包括:接收所述堆叠系统的从属设备发送的第一通知报文,所述第一通知报文用于指示发送所述第一通知报文的从属设备的交换矩阵板卡发生故障;向所述堆叠系统的所有从属设备发送第二通知报文;所述第二通知报文用于指示堆叠系统的所有从属设备将发送所述第一通知报文的从属设备的软件状态设置为异常状态,并计算获取目标单播转发路径,所述目标单播转发路径中不包含发送所述第一通知报文的从属设备。

【技术特征摘要】
1.一种堆叠系统故障处理方法,其特征在于,应用于堆叠系统的主控设备,所述方法包括:接收所述堆叠系统的从属设备发送的第一通知报文,所述第一通知报文用于指示发送所述第一通知报文的从属设备的交换矩阵板卡发生故障;向所述堆叠系统的所有从属设备发送第二通知报文;所述第二通知报文用于指示堆叠系统的所有从属设备将发送所述第一通知报文的从属设备的软件状态设置为异常状态,并计算获取目标单播转发路径,所述目标单播转发路径中不包含发送所述第一通知报文的从属设备。2.根据权利要求1所述的堆叠系统故障处理方法,其特征在于,若所述堆叠系统为非链形堆叠系统,则在所述接收到从属设备发送的第一通知报文之后,所述方法还包括:获取第一广播转发路径,所述第一广播转发路径中发送所述第一通知报文的从属设备为广播断环点;向所述堆叠系统的所有从属设备发送所述第一广播转发路径,所述广播转发路径用于指示所述堆叠系统的所有从属设备将根据所述广播转发路径对广播形式的报文进行转发。3.根据权利要求1所述的堆叠系统故障处理方法,其特征在于,在所述接收到从属设备发送的第一通知报文之后,所述方法还包括:禁止开启发送所述第一通知报文的从属设备的业务板卡的业务端口。4.根据权利要求1所述的堆叠系统故障处理方法,其特征在于,所述方法还包括:接收发送所述第一通知报文的从属设备发送的第三通知报文,所述第三通知报文用于指示所述交换矩阵板卡的故障已恢复;向所述堆叠系统的所有从属设备发送第四通知报文;所述第四通知报文用于指示堆叠系统的所有从属设备将所述发送所述第一通知报文的从属设备的软件状态设置为正常状态,并重新计算单播转发路径。5.一种堆叠系统故障处理方法,其特征在于,应用于堆叠系统的从属设备,所述方法包括:检测本设备的交换矩阵板卡是否发生故障;若确定所述交换矩阵板卡发生故障,则关闭本设备的所有业务板卡上的业务端口,并向所述堆叠系统的主控设备发送第一通知报文;所述第一通知报文用于指示本设备的交换矩阵板卡发生故障。6.根据权利要求5所述的堆叠系统故障处理方法,其特征在于,若所述堆叠系统为非链形堆叠系统,则在向所述堆叠系统的主控设备发送第一通知报文之后,所述方法还包括:接收所述主控设备发送的第一广播转发路径,所述第一广播转发路径中本设备为广播断环点;根据所述第一广播转发路径禁止对广播形式的报文进行转发。7.根据权利要求5所述的堆叠系统故障处理方法,其特征在于,所述方法还包括:确定本设备的堆叠端口是否设置在多张业务板卡上;若是,则确定是否存在目标业务板卡,所述目标业务板卡为堆叠端口直连的对端成员设备包括本设备的所有直连成员设备的业务板卡;若仅存在一张目标业务板卡,则关闭本设备上除所述目标业务板卡以外其他业务板卡上的堆叠端口;若存在多张目标业务板卡,则根据第一预设规则在所述多张目标业务板卡中选取第一业务板卡,并关闭所述本设备上除所述第一业务板卡以外其他业务板卡上的堆叠端口;若不存在目标业务板卡,则根据第二预设规则在所述本设备的业务板卡中选取目标业务板卡集合,并关闭所述本设备上除所述目标业务板卡集合中的业务板卡以外其他业务板卡上的堆叠端口;所述目标业务板卡集合中的业务板卡的堆叠端口的对端成员设备的合集包括所述本设备的所有直连成员设备。8.根据权利要求7所述的堆叠系统故障处理方法,其特征在于,所述方法还包括:当确定交换矩阵板卡的故障修复之后,向所述主控设备发送第三通知报文并开启所有业务板卡的所有端口;所述第三通知报文用于指示本设备的交换矩阵板卡的故障已恢复。9.一种堆叠系统故障处理方法,其特征在于,应用于堆叠系统的从属设备,所述方法包括:接收所述堆叠系统的主控设备在接收到第一通知报文后发出的第二通知报文,所述第一通知报文用于指示发送所述第一通知报文的从属设备的交换矩阵板卡发生故障,所述第二通知报文用于指示本设备将发送所述第一通知报文的从属设备的软件状态设置为异常状态,并计算获取目标单播转发路径,所述目标单播转发路径中不包含所述从属设备。10.根据权利要求9所述的堆叠系统故障处理方法,其特征在于,当所述堆叠系统为非链式堆叠系统,所述计算获取目标单播转发路径包括:在本设备到所述目的设备的路径中选取不经过发送所述第一通知报文的从属设备的路径作为所述单播转发路径。11.一种堆叠系统的主控设备,其特征在于,包括:接收单元,接收所述堆叠系统的从属设备发送的第一通知报文,所述第一通知报文用于指示所述从属设备的交换矩阵板卡发生故障;发送单...

【专利技术属性】
技术研发人员:董琴
申请(专利权)人:迈普通信技术股份有限公司
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1