The invention discloses a fault detection method and related equipment and stacking system. Among them, a fault detection method, applied to the stack system, the first communication device includes a first plate and a second plate business business, the first business board includes a first processor and a first device, the second business board includes a second processor and the second device, the second device receives a first signal from the first device, abnormal port number second communication device instructions the first signal based on the updated total abnormal current port second communication device, if the total abnormal current second port communication equipment updated to meet failure recognition conditions corresponding to the second communication device, notice second processor second communication equipment or part of the whole failure. The embodiment of the invention provides a scheme to improve the efficiency and reliability of the fault detection.
【技术实现步骤摘要】
本专利技术涉及通信
,具体涉及一种故障检测方法及相关设备和堆叠系统。
技术介绍
当前,堆叠技术(包括堆叠和集群技术等)在数通设备应用广泛,而堆叠技术大多都是通过如以太、高速以太等数据通道连接,将多台数通设备组建成一个堆叠系统。使用数据通道建立的堆叠系统,每一台数通设备与邻接数通设备之间可能只有数据通道。数通设备通常包括至少1个业务板,每个业务板包括至少1个用于业务处理的处理器。在邻接通信设备部分或整体失效时,通常需要本端通信设备自身通过检测来发现故障,以便及时进行相应的应急处理,现有技术通常是由本端通信设备中用于业务处理的处理器来直接监测各数据通道的端口状态,并由该处理器根据监测结果判断邻接通信设备是否部分或整体失效。实践发现,监测邻接通信设备是否部分或整体失效的现有机制通常需较长时间且可靠性低,已难以满足快速故障处理需求。
技术实现思路
本专利技术实施例提供一种故障检测方法及相关设备和堆叠系统,以期提高故障检测效率和可靠性。本专利技术第一方面提供一种故障检测方法,应用于堆叠系统,所述堆叠系统包括第一通信设备和第二通信设备,其中,所述第一通信设备包括第一业务板和第二业务板,所述第一业务板包括第一处理器和第一器件,所述第二业务板包括第二处理器和第二器件,其中,所述第一处理器和所述第二处理器用于业务处理,所述第一通信设备和第二通信设备通过M个端口互联,所述第一器件包括处理器和
【技术保护点】
一种故障检测方法,应用于堆叠系统,其特征在于,所述堆叠系统包括第一通信设备和第二通信设备,其中,所述第一通信设备包括第一业务板和第二业务板,所述第一业务板包括第一处理器和第一器件,所述第二业务板包括第二处理器和第二器件,其中,所述第一处理器和所述第二处理器用于业务处理,所述第一通信设备和第二通信设备通过M个端口互联,所述第一器件包括处理器和/或可编程逻辑器件,所述第二器件包括处理器和/或可编程逻辑器件;其中,所述故障检测方法包括:所述第二器件接收来自所述第一器件的第一信号,基于所述第一信号所指示的所述第二通信设备的异常端口数,更新所述第二通信设备当前的异常端口总数,若更新后的所述第二通信设备当前的异常端口总数满足所述第二通信设备对应的失效确认条件,则通知所述第二处理器所述第二通信设备部分或整体失效,其中,所述第一信号由所述第一器件在接收到所述第一业务板的N1个端口发起的端口异常中断信号之后发送,所述第一信号指示出所述第二通信设备的N1个端口存在异常,所述N1个端口为所述M个端口中的部分或者全部端口。
【技术特征摘要】
1.一种故障检测方法,应用于堆叠系统,其特征在于,所述堆叠系统包
括第一通信设备和第二通信设备,其中,所述第一通信设备包括第一业务板和
第二业务板,所述第一业务板包括第一处理器和第一器件,所述第二业务板包
括第二处理器和第二器件,其中,所述第一处理器和所述第二处理器用于业务
处理,所述第一通信设备和第二通信设备通过M个端口互联,所述第一器件
包括处理器和/或可编程逻辑器件,所述第二器件包括处理器和/或可编程逻辑
器件;
其中,所述故障检测方法包括:
所述第二器件接收来自所述第一器件的第一信号,基于所述第一信号所指
示的所述第二通信设备的异常端口数,更新所述第二通信设备当前的异常端口
总数,若更新后的所述第二通信设备当前的异常端口总数满足所述第二通信设
备对应的失效确认条件,则通知所述第二处理器所述第二通信设备部分或整体
失效,其中,所述第一信号由所述第一器件在接收到所述第一业务板的N1个
端口发起的端口异常中断信号之后发送,所述第一信号指示出所述第二通信设
备的N1个端口存在异常,所述N1个端口为所述M个端口中的部分或者全部
端口。
2.根据权利要求1所述的方法,其特征在于,
所述第一通信设备还包括第三业务板,所述第三业务板包括第三处理器和
第三器件,其中,所述第三处理器用于业务处理,所述第三器件包括处理器和
/或可编程逻辑器件;
所述方法还包括:所述第二器件接收来自所述第三器件的第二信号,基于
所述第二信号所指示的所述第二通信设备的异常端口数,更新所述第二通信设
备当前的异常端口总数,若更新后的所述第二通信设备当前的异常端口总数满
足所述第二通信设备对应的失效确认条件,则通知所述第二处理器所述第二通
信设备部分或整体失效,其中,所述第二信号由所述第三器件在接收到所述第
三业务板的N2个端口发起的端口异常中断信号之后发送,所述第二信号指示
出所述第二通信设备的N2个端口存在异常,所述N2个端口为所述M个端口中
的部分端口。
3.根据权利要求1或2所述的方法,其特征在于,
所述方法还包括:所述第二器件接收所述第二业务板的N3个端口发起的
端口异常中断信号,其中,所述N3个端口为所述M个端口中的部分端口,基于
所述N3更新所述第二通信设备当前的异常端口总数,若更新后的所述第二通
信设备当前的异常端口总数满足所述第二通信设备对应的失效确认条件,则通
知所述第二处理器所述第二通信设备部分或整体失效。
4.根据权利要求1至3任一项所述的方法,其特征在于,
所述若更新后的所述第二通信设备当前的异常端口总数满足所述第二通
信设备对应的失效确认条件,则通知所述第二处理器所述第二通信设备部分或
整体失效,包括:
若更新后的所述第二通信设备当前的异常端口总数等于所述M,则通知
第二处理器所述第二通信设备整体失效;或者,若更新后的所述第二通信设备
当前的异常端口总数大于或等于所述M-X1,则通知所述第二处理器所述第二
通信设备部分或整体失效,其中,所述X1小于所述M;或者,若更新后的所
述第二通信设备当前的异常端口总数大于或等于X2%*M,则通知所述第二处
理器所述第二通信设备部分或整体失效,其中,所述X2大于0且小于或等于
100。
5.根据权利要求1至4任一项所述的方法,其特征在于,
所述堆叠系统还包括第三通信设备,其中,所述第一通信设备和所述第三
通信设备通过Y个端口互联;
所述故障检测方法还包括:
所述第二器件接收来自所述第一器件的第四信号,基于所述第四信号所指
示的所述第三通信设备的异常端口数,更新所述第三通信设备当前的异常端口
总数,若更新后的所述第三通信设备当前的异...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。