故障检测方法及相关设备和堆叠系统技术方案

技术编号:16331852 阅读:33 留言:0更新日期:2017-10-01 23:50
本发明专利技术公开了一种故障检测方法及相关设备和堆叠系统。其中,一种故障检测方法,应用于堆叠系统,第一通信设备包括第一业务板和第二业务板,第一业务板包括第一处理器和第一器件,第二业务板包括第二处理器和第二器件,第二器件接收来自第一器件的第一信号,基于第一信号所指示的第二通信设备的异常端口数,更新第二通信设备当前的异常端口总数,若更新后的第二通信设备当前的异常端口总数满足第二通信设备对应的失效确认条件,则通知第二处理器第二通信设备部分或整体失效。本发明专利技术实施例提供方案提高故障检测效率和可靠性。

Fault detecting method, related equipment and stacking system

The invention discloses a fault detection method and related equipment and stacking system. Among them, a fault detection method, applied to the stack system, the first communication device includes a first plate and a second plate business business, the first business board includes a first processor and a first device, the second business board includes a second processor and the second device, the second device receives a first signal from the first device, abnormal port number second communication device instructions the first signal based on the updated total abnormal current port second communication device, if the total abnormal current second port communication equipment updated to meet failure recognition conditions corresponding to the second communication device, notice second processor second communication equipment or part of the whole failure. The embodiment of the invention provides a scheme to improve the efficiency and reliability of the fault detection.

【技术实现步骤摘要】

本专利技术涉及通信
,具体涉及一种故障检测方法及相关设备和堆叠系统
技术介绍
当前,堆叠技术(包括堆叠和集群技术等)在数通设备应用广泛,而堆叠技术大多都是通过如以太、高速以太等数据通道连接,将多台数通设备组建成一个堆叠系统。使用数据通道建立的堆叠系统,每一台数通设备与邻接数通设备之间可能只有数据通道。数通设备通常包括至少1个业务板,每个业务板包括至少1个用于业务处理的处理器。在邻接通信设备部分或整体失效时,通常需要本端通信设备自身通过检测来发现故障,以便及时进行相应的应急处理,现有技术通常是由本端通信设备中用于业务处理的处理器来直接监测各数据通道的端口状态,并由该处理器根据监测结果判断邻接通信设备是否部分或整体失效。实践发现,监测邻接通信设备是否部分或整体失效的现有机制通常需较长时间且可靠性低,已难以满足快速故障处理需求。
技术实现思路
本专利技术实施例提供一种故障检测方法及相关设备和堆叠系统,以期提高故障检测效率和可靠性。本专利技术第一方面提供一种故障检测方法,应用于堆叠系统,所述堆叠系统包括第一通信设备和第二通信设备,其中,所述第一通信设备包括第一业务板和第二业务板,所述第一业务板包括第一处理器和第一器件,所述第二业务板包括第二处理器和第二器件,其中,所述第一处理器和所述第二处理器用于业务处理,所述第一通信设备和第二通信设备通过M个端口互联,所述第一器件包括处理器和/或可编程逻辑器件,所述第二器件包括处理器和/或可编程逻辑器件;其中,所述故障检测方法包括:所述第二器件接收来自所述第一器件的第一信号,基于所述第一信号所指示的所述第二通信设备的异常端口数,更新所述第二通信设备当前的异常端口总数,若更新后的所述第二通信设备当前的异常端口总数满足所述第二通信设备对应的失效确认条件,则通知所述第二处理器所述第二通信设备部分或整体失效,其中,所述第一信号由所述第一器件在接收到所述第一业务板的N1个端口发起的端口异常中断信号之后发送,所述第一信号指示出所述第二通信设备的N1个端口存在异常,所述N1个端口为所述M个端口中的部分或者全部端口。结合第一方面,在第一种可能的实施方式中,所述第一通信设备还包括第三业务板,所述第三业务板包括第三处理器和第三器件,其中,所述第三处理器用于业务处理,所述第三器件包括处理器和/或可编程逻辑器件;所述方法还包括:所述第二器件接收来自所述第三器件的第二信号,基于所述第二信号所指示的所述第二通信设备的异常端口数,更新所述第二通信设备当前的异常端口总数,若更新后的所述第二通信设备当前的异常端口总数满足所述第二通信设备对应的失效确认条件,则通知所述第二处理器所述第二通信设备部分或整体失效,其中,所述第二信号由所述第三器件在接收到所述第三业务板的N2个端口发起的端口异常中断信号之后发送,所述第二信号指示出所述第二通信设备的N2个端口存在异常,所述N2个端口为所述M个端口中的部分端口。结合第一方面或第一方面的第一种可能的实施方式,在第二种可能的实施方式中,所述方法还包括:所述第二器件接收所述第二业务板的N3个端口发起的端口异常中断信号,其中,所述N3个端口为所述M个端口中的部分端口,基于所述N3更新所述第二通信设备当前的异常端口总数,若更新后的所述第二通信设备当前的异常端口总数满足所述第二通信设备对应的失效确认条件,则通知所述第二处理器所述第二通信设备部分或整体失效。结合第一方面或第一方面的第一种可能的实施方式或第一方面的第二种可能的实施方式,在第三种可能的实施方式中,所述若更新后的所述第二通信设备当前的异常端口总数满足所述第二通信设备对应的失效确认条件,则通知所述第二处理器所述第二通信设备部分或整体失效,包括:若更新后的所述第二通信设备当前的异常端口总数等于所述M,则通知第二处理器所述第二通信设备整体失效;或者,若更新后的所述第二通信设备当前的异常端口总数大于或等于所述M-X1,则通知所述第二处理器所述第二通信设备部分或整体失效,其中,所述X1小于所述M;或者,若更新后的所述第二通信设备当前的异常端口总数大于或等于X2%*M,则通知所述第二处理器所述第二通信设备部分或整体失效,其中,所述X2大于0且小于或等于100。结合第一方面或第一方面的第一种可能的实施方式或第一方面的第二种可能的实施方式或第一方面的第三种可能的实施方式,在第四种可能的实施方式中,所述堆叠系统还包括第三通信设备,其中,所述第一通信设备和所述第三通信设备通过Y个端口互联;所述故障检测方法还包括:所述第二器件接收来自所述第一器件的第四信号,基于所述第四信号所指示的所述第三通信设备的异常端口数,更新所述第三通信设备当前的异常端口总数,若更新后的所述第三通信设备当前的异常端口总数满足所述第三通信设备对应的失效确认条件,则通知所述第二处理器所述第三通信设备部分或整体失效,其中,所述第四信号由所述第一器件在接收到所述第一业务板的W1个端口发起的端口异常中断信号之后发送,所述第四信号指示出所述第三通信设备的W1个端口存在异常,所述W1个端口为所述Y个端口中的部分或者全部端口。本专利技术第二方面提供一种通信设备,所述通信设备通过M个端口与第二通信设备互联,其中,所述通信设备包括:第一业务板和第二业务板,所述第一业务板包括:第一处理器和第一器件,所述第二业务板包括:第二处理器和第二器件,其中,所述第一处理器和所述第二处理器用于业务处理,所述第一器件包括处理器和/或可编程逻辑器件,所述第二器件包括处理器和/或可编程逻辑器件;所述第二器件,用于接收来自所述第一器件的第一信号,基于所述第一信号所指示的所述第二通信设备的异常端口数,更新所述第二通信设备当前的异常端口总数,若更新后的所述第二通信设备当前的异常端口总数满足所述第二通信设备对应的失效确认条件,则通知所述第二处理器所述第二通信设备部分或整体失效,其中,所述第一信号由所述第一器件在接收到所述第一业务板的N1个端口发起的端口异常中断信号之后发送,所述第一信号指示出所述第二通信设备的N1个端口存在异常,所述N1个端口为所述M个端口中的部分或者全部端口。结合第二方面,在第一种可能的实施方式中,所述通信设备还包括第三业务板,所述第三业务板包括第三处理器和第三器件,其中,所述第三处理器用于业务处理,所述第三器件包括处理器和/或可编程逻辑器件;...
故障检测方法及相关设备和堆叠系统

【技术保护点】
一种故障检测方法,应用于堆叠系统,其特征在于,所述堆叠系统包括第一通信设备和第二通信设备,其中,所述第一通信设备包括第一业务板和第二业务板,所述第一业务板包括第一处理器和第一器件,所述第二业务板包括第二处理器和第二器件,其中,所述第一处理器和所述第二处理器用于业务处理,所述第一通信设备和第二通信设备通过M个端口互联,所述第一器件包括处理器和/或可编程逻辑器件,所述第二器件包括处理器和/或可编程逻辑器件;其中,所述故障检测方法包括:所述第二器件接收来自所述第一器件的第一信号,基于所述第一信号所指示的所述第二通信设备的异常端口数,更新所述第二通信设备当前的异常端口总数,若更新后的所述第二通信设备当前的异常端口总数满足所述第二通信设备对应的失效确认条件,则通知所述第二处理器所述第二通信设备部分或整体失效,其中,所述第一信号由所述第一器件在接收到所述第一业务板的N1个端口发起的端口异常中断信号之后发送,所述第一信号指示出所述第二通信设备的N1个端口存在异常,所述N1个端口为所述M个端口中的部分或者全部端口。

【技术特征摘要】
1.一种故障检测方法,应用于堆叠系统,其特征在于,所述堆叠系统包
括第一通信设备和第二通信设备,其中,所述第一通信设备包括第一业务板和
第二业务板,所述第一业务板包括第一处理器和第一器件,所述第二业务板包
括第二处理器和第二器件,其中,所述第一处理器和所述第二处理器用于业务
处理,所述第一通信设备和第二通信设备通过M个端口互联,所述第一器件
包括处理器和/或可编程逻辑器件,所述第二器件包括处理器和/或可编程逻辑
器件;
其中,所述故障检测方法包括:
所述第二器件接收来自所述第一器件的第一信号,基于所述第一信号所指
示的所述第二通信设备的异常端口数,更新所述第二通信设备当前的异常端口
总数,若更新后的所述第二通信设备当前的异常端口总数满足所述第二通信设
备对应的失效确认条件,则通知所述第二处理器所述第二通信设备部分或整体
失效,其中,所述第一信号由所述第一器件在接收到所述第一业务板的N1个
端口发起的端口异常中断信号之后发送,所述第一信号指示出所述第二通信设
备的N1个端口存在异常,所述N1个端口为所述M个端口中的部分或者全部
端口。
2.根据权利要求1所述的方法,其特征在于,
所述第一通信设备还包括第三业务板,所述第三业务板包括第三处理器和
第三器件,其中,所述第三处理器用于业务处理,所述第三器件包括处理器和
/或可编程逻辑器件;
所述方法还包括:所述第二器件接收来自所述第三器件的第二信号,基于
所述第二信号所指示的所述第二通信设备的异常端口数,更新所述第二通信设
备当前的异常端口总数,若更新后的所述第二通信设备当前的异常端口总数满
足所述第二通信设备对应的失效确认条件,则通知所述第二处理器所述第二通
信设备部分或整体失效,其中,所述第二信号由所述第三器件在接收到所述第
三业务板的N2个端口发起的端口异常中断信号之后发送,所述第二信号指示
出所述第二通信设备的N2个端口存在异常,所述N2个端口为所述M个端口中
的部分端口。
3.根据权利要求1或2所述的方法,其特征在于,
所述方法还包括:所述第二器件接收所述第二业务板的N3个端口发起的
端口异常中断信号,其中,所述N3个端口为所述M个端口中的部分端口,基于
所述N3更新所述第二通信设备当前的异常端口总数,若更新后的所述第二通
信设备当前的异常端口总数满足所述第二通信设备对应的失效确认条件,则通
知所述第二处理器所述第二通信设备部分或整体失效。
4.根据权利要求1至3任一项所述的方法,其特征在于,
所述若更新后的所述第二通信设备当前的异常端口总数满足所述第二通
信设备对应的失效确认条件,则通知所述第二处理器所述第二通信设备部分或
整体失效,包括:
若更新后的所述第二通信设备当前的异常端口总数等于所述M,则通知
第二处理器所述第二通信设备整体失效;或者,若更新后的所述第二通信设备
当前的异常端口总数大于或等于所述M-X1,则通知所述第二处理器所述第二
通信设备部分或整体失效,其中,所述X1小于所述M;或者,若更新后的所
述第二通信设备当前的异常端口总数大于或等于X2%*M,则通知所述第二处
理器所述第二通信设备部分或整体失效,其中,所述X2大于0且小于或等于
100。
5.根据权利要求1至4任一项所述的方法,其特征在于,
所述堆叠系统还包括第三通信设备,其中,所述第一通信设备和所述第三
通信设备通过Y个端口互联;
所述故障检测方法还包括:
所述第二器件接收来自所述第一器件的第四信号,基于所述第四信号所指
示的所述第三通信设备的异常端口数,更新所述第三通信设备当前的异常端口
总数,若更新后的所述第三通信设备当前的异...

【专利技术属性】
技术研发人员:王晶
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1