一种网络设备故障处理方法及装置制造方法及图纸

技术编号:21576865 阅读:14 留言:0更新日期:2019-07-10 16:53
本申请提供一种网络设备故障处理方法及装置。一种网络设备故障处理方法,所述方法包括:按照预设的第一监测周期,监测网络设备中主控板卡是否满足预设的第一要求,所述预设的第一要求是主控板卡被热插拔或发生异常;若网络设备中主控板卡满足预设的要求,停止转发所有业务板卡对所述主控板卡的访问指令,并向所有业务板卡发送停止访问所述主控板卡的指令;按照预设的第二监测周期,监测网络设备中业务板卡是否满足预设的第二要求,所述预设的第二要求是业务板卡被热插拔或发生异常;若网络设备中业务板卡满足预设的第二要求,则停止转发主控板卡对所述业务板卡的访问指令,并向主控板卡发送停止访问所述业务板卡的指令。

A Fault Handling Method and Device for Network Equipment

【技术实现步骤摘要】
一种网络设备故障处理方法及装置
本申请涉及通信
,尤其涉及一种网络设备故障处理方法及装置。
技术介绍
随着计算机和互联网的不断发展,用户对通信质量的要求越来越高,这就要求网络设备在发生故障时仍能继续保持完整和稳定的工作。由于PCIe(PeripheralComponentInterconnectexpress,高速串行计算机扩展总线标准)协议支持主动电源管理、错误报告、端对端的可靠性传输、热插拔以及服务质量等功能,被广泛应用于网络设备,可以作为主板级互连、无源背板互连,从而提高网络设备的可靠性。与此同时,为了保证网络设备能够持续稳定的工作,避免由于网络设备故障带来的经济损失,网络设备中主控板卡一侧与业务板卡一侧分别引入了主备切换以及热插拔机制。相关技术中网络设备虽然可以支持主备切换以及热插拔机制,但是网络设备故障的发生是不可控的,当发生主备切换或热插拔事件时,主控板卡与业务板卡正在通信,很可能由于通知不及时导致网络设备发生预想不到的异常。例如,主控板卡与业务板卡正常通信,当暴力移除主控板卡时,业务板卡由于未及时接收到主控板卡的响应而异常,可能导致业务板卡无法响应备用板卡的指令。
技术实现思路
有鉴于此,本申请提供一种网络设备故障处理方法及装置。具体地,本申请是通过如下技术方案实现的:一种网络设备故障处理方法,应用于现场可编程门阵列,所述方法包括:按照预设的第一监测周期,监测网络设备中主控板卡是否满足预设的第一要求,所述预设的第一要求是主控板卡被热插拔或发生异常;若网络设备中主控板卡满足预设的要求,停止转发所有业务板卡对所述主控板卡的访问指令,并向所有业务板卡发送停止访问所述主控板卡的指令;按照预设的第二监测周期,监测网络设备中业务板卡是否满足预设的第二要求,所述预设的第二要求是业务板卡被热插拔或发生异常;若网络设备中业务板卡满足预设的第二要求,则停止转发主控板卡对所述业务板卡的访问指令,并向主控板卡发送停止访问所述业务板卡的指令。一种网络设备故障处理装置,应用于现场可编程门阵列,所述装置包括:第一监测模块,用于按照预设的第一监测周期,监测网络设备中主控板卡是否满足预设的第一要求,所述预设的第一要求是主控板卡被热插拔或发生异常;第一处理模块,用于若网络设备中主控板卡满足预设的要求,停止转发所有业务板卡对所述主控板卡的访问指令,并向所有业务板卡发送停止访问所述主控板卡的指令;第二监测模块,用于按照预设的第二监测周期,监测网络设备中业务板卡是否满足预设的第二要求,所述预设的第二要求是业务板卡被热插拔或发生异常;第二处理模块,用于若网络设备中业务板卡满足预设的第二要求,则停止转发主控板卡对所述业务板卡的访问指令,并向主控板卡发送停止访问所述业务板卡的指令。本申请实施例提供的技术方案,通过引入现场可编程门阵列(FPGA)介于主控板卡(或备用板卡)和业务板卡之间,利用FPGA能够对网络设备中故障进行监测,并能在故障发生的第一时刻做出响应,避免网络设备发生预想不到的异常。附图说明为了更清楚地说明本申请实施例的技术方案,下面将对实施例描述中所需要的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。图1是本申请一示例性实施例示出的一种网络设备内部系统结构示意图;图2是本申请一示例性实施例示出的另一种网络设备内部系统结构示意图;图3是本申请一示例性实施例示出的一种网络设备故障处理的实施流程示意图;图4是本申请一示例性实施例示出的一种网络设备故障处理装置的结构示意图。具体实施方式这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。应当理解,尽管在本申请可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。相关技术中如图1所示,在当前网络设备中主控板卡通过PCIeSwitch芯片(PCIe交换芯片/PCIe桥片)进行接口扩展,连接多个业务板卡,在业务板卡上通过开关电路选择PCIe链路,确定与主控板卡进行通信,还是与备用板卡进行通信。当网络设备进行主备切换时,可以通过控制开关电路来实现,当业务板卡发生热插拔时,可以通过启动PCIe标准热插拔流程来实现。虽然目前网络设备中可以支持主备切换以及热插拔机制,但是网络设备故障的发生是不可控的,当发生主备切换或者热插拔事件时,主控板卡与业务板卡正在通信,很可能由于通知不及时导致网络设备发生预想不到的异常。例如,主控板卡与业务板卡正常通信,当暴力移除主控板卡时,业务板卡由于未及时接收到主控板卡的响应而异常,可能导致业务板卡无法响应备用板卡的指令。如果业务板卡正在进行内存访问,备用板卡的内存可能存在被非法修改的风险。针对上述技术问题,本申请实施例提供了一种更加稳定可靠的网络设备系统架构,如图2所示,引入了现场可编程门阵列(FPGA)介于主控板卡(或备用板卡)和业务板卡之间,利用FPGA替换原先的PCIe交换芯片/PCIe桥片,能够对网络设备中故障进行监测,并能在故障发生的第一时刻做出响应,避免网络设备发生预想不到的异常。为了对本申请进一步说明,提供下列实施例:如图3所示,为本申请实施例网络设备故障处理方法的实施流程示意图,该方法具体可以包括以下步骤:S301,按照预设的第一监测周期,监测网络设备中主控板卡是否满足预设的第一要求,所述预设的第一要求是主控板卡被热插拔或发生异常;本申请实施例应用于FPGA,按照预设的第一监测周期,监测网络设备中主控板卡是否满足预设的第一要求,该预设的第一要求可以是主控板卡被热插拔或者主控板卡发生异常,主控板卡发生异常意味着要进行主备切换。若网络设备中主控板卡未满足预设的要求,同时业务板卡也未满足预设的要求,则表示网络设备正常运行,FPGA可以接收主控板卡对业务板卡的访问指令,并转发至对应业务板卡,与此同时也可以接收业务板卡对主控板卡的访问指令,并转发至主控板卡。其中在进行指令转发的过程中,基于地址映射进行转发,地址映射即业务板卡地址空间与FPGA自身地址空间,以及主控CPU或备用CPU地址空间与FPGA自身地址空间建立映射关系,如下表1、表2所示:CPUFPGA业务板卡地址空间主控CPU或备用CPU地址空间1业务板卡1地址空间主控CPU或备用CPU地址空间2业务板卡2地址空间主控CPU或本文档来自技高网...

【技术保护点】
1.一种网络设备故障处理方法,其特征在于,应用于现场可编程门阵列,所述方法包括:按照预设的第一监测周期,监测网络设备中主控板卡是否满足预设的第一要求,所述预设的第一要求是主控板卡被热插拔或发生异常;若网络设备中主控板卡满足预设的要求,停止转发所有业务板卡对所述主控板卡的访问指令,并向所有业务板卡发送停止访问所述主控板卡的指令;按照预设的第二监测周期,监测网络设备中业务板卡是否满足预设的第二要求,所述预设的第二要求是业务板卡被热插拔或发生异常;若网络设备中业务板卡满足预设的第二要求,则停止转发主控板卡对所述业务板卡的访问指令,并向主控板卡发送停止访问所述业务板卡的指令。

【技术特征摘要】
1.一种网络设备故障处理方法,其特征在于,应用于现场可编程门阵列,所述方法包括:按照预设的第一监测周期,监测网络设备中主控板卡是否满足预设的第一要求,所述预设的第一要求是主控板卡被热插拔或发生异常;若网络设备中主控板卡满足预设的要求,停止转发所有业务板卡对所述主控板卡的访问指令,并向所有业务板卡发送停止访问所述主控板卡的指令;按照预设的第二监测周期,监测网络设备中业务板卡是否满足预设的第二要求,所述预设的第二要求是业务板卡被热插拔或发生异常;若网络设备中业务板卡满足预设的第二要求,则停止转发主控板卡对所述业务板卡的访问指令,并向主控板卡发送停止访问所述业务板卡的指令。2.根据权利要求1所述的方法,其特征在于,所述若网络设备中主控板卡满足预设的要求,停止转发所有业务板卡对所述主控板卡的访问指令,并向所有业务板卡发送停止访问所述主控板卡的指令,包括:若网络设备中主控板卡满足预设的要求,判断满足的预设的要求是否为主控板卡发生异常;若否,停止转发所有业务板卡对所述主控板卡的访问指令,并向所有业务板卡发送停止访问所述主控板卡的指令。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:若是,停止转发所有业务板卡对所述主控板卡的访问指令,向所有业务板卡发送停止访问所述主控板卡的指令,按照预设的第三监测周期监测是否接收到备用板卡发送的业务板卡访问指令;当接收到备用板卡发送的业务板卡访问指令时,转发至对应业务板卡,并向所有业务板卡发送访问备用板卡的指令。4.根据权利要求1所述的方法,其特征在于,所述若网络设备中业务板卡满足预设的第二要求,则停止转发主控板卡对所述业务板卡的访问指令,并向主控板卡发送停止访问所述业务板卡的指令,包括:若网络设备中业务板卡满足预设的第二要求,根据现场可编程门阵列与业务板卡之间链路的标识或者业务板卡标识确定满足预设的第二要求的业务板卡;停止转发主控板卡对满足预设的第二要求的业务板卡的访问指令,并向主控板卡发送停止访问满足预设的第二要求的业务板卡的指令。5.根据权利要求1至4任一项所述的方法,其特征在于,所述方法还包括:若网络设备中主控板卡满足预设的要求,则对现场...

【专利技术属性】
技术研发人员:刘彦静
申请(专利权)人:杭州迪普科技股份有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1