一种机载交换网络设备故障监控方法技术

技术编号:18355826 阅读:36 留言:0更新日期:2018-07-02 09:08
本发明专利技术属于机载通信网络技术领域,涉及机载交换网络设备的故障监控方法。一种机载交换网络设备故障监控方法,本方法基于一组WDT看门狗定时器、一组TIMER周期狗定时器以及一组网络消息,能够实时监测机载交换网络系统内各网络设备的健康状态,快速捕获系统中网络设备的故障信息,为上层系统或者应用提供故障管理支持,这对于机载交换网络系统稳定可靠地运行,以及有效地控制管理有着至关重要的作用。

【技术实现步骤摘要】
一种机载交换网络设备故障监控方法
本专利技术属于机载通信网络
,涉及机载交换网络设备的故障监控方法。
技术介绍
随着新一代飞机航电系统数字化、综合化程度日益加深,航电系统已采用网络化架构,高速交换网络系统已成为先进航电系统的核心通信平台。面向综合化的航电系统通常采用分布式、开放体系架构,通过高速交换网络实现资源、信息共享和功能综合。机载交换网络系统由一组网络终端和网络交换机构成,网络终端和网络交换机统称为网络设备。其中,网络交换机是交换网络系统的核心部件,所有网络终端通过物理链路与网络交换机相连,网络终端则作为机载系统传感、计算、作动等功能节点的通信接口实现整个网络系统的分布式通信和管理。网络终端一般由主机(HOST)和通信接口(NIC)组成,其中HOST和NIC通过标准主机总线接口(HBI)进行物理耦合,比如PCI、PCIE和SRIO等。在如图1所示的星型机载网络拓扑结构中,网络交换机作为机载交换网络系统中的核心部件为网络终端提供数据交换支持,网络终端为主机应用提供外部接口通信支持。交换网络系统采用分布式开放体系架构,具备良好的伸缩性、适应性和系统容错重构能力,但由于网络设备故障关联性高,耦合紧密,导致故障诊断和隔离防护困难,网络系统故障行为不可控,因而无法有效保障机载系统可靠运行。为此,需设计一种故障监控机制,能够实时监测机载交换网络系统内各网络设备的健康状态,快速捕获系统中网络设备的故障信息,为上层系统或者应用提供故障管理支持,这对于机载交换网络系统稳定可靠地运行,以及有效地控制管理有着至关重要的作用。
技术实现思路
本专利技术的目的是:针对机载交换网络系统提供一种网络设备故障的监控方法,能够实时监测网络系统内各设备的故障状态,获取故障信息,为上层系统或应用提供网络故障管理支持。为达到以上目的,本专利技术是采取如下技术方案予以实现的:如图2所示,一种机载交换网络设备故障监控方法,本方法基于一组WDT看门狗定时器、一组TIMER周期定时器以及一组网络消息,其中,WDT看门狗定时器包括:a.主机健康监控看门狗HOST_ALIVE_WDT;b.通信接口健康监控看门狗NIC_ALIVE_WDT;c.网络管理器健康监控看门狗NC_ALIVE_WDT;d.交换机健康监控看门狗SW_ALIVE_WDT;TIMER周期定时器包括:a.主机周期喂狗定时器HOST_ALIVE_TIMER;b.通信接口周期喂狗定时器NIC_ALIVE_TIMER;c.网络管理器周期喂狗定时器NC_ALIVE_TIMER;d.交换机周期喂狗定时器SW_ALIVE_TIMER;其中,WDT看门狗定时器需有硬件支持,TIMER定时器可以是硬件逻辑实现的定时器也可以是由软件实现的周期任务。网络消息包括:a.交换机链路状态汇报消息SW_ALIVE_MSG;b.网络状态汇报消息NC_ALIVE_MSG;本方法包括以下步骤:(1)通过HOST与NIC相互获取对方生命信息的方式实现终端节点内部健康状态双向监控;(2)NT终端节点HOST故障由终端内部故障监控机制感知,其NIC主动发送通信故障信息至NC,并将自身置为不可通信状态。NC收到该NT终端发送的故障信息后,在下一个广播周期通过NC_ALIVE_MSG通报全网络,其它终端由此获知NT终端发生故障;(3)NT终端节点NIC故障由交换机感知并通报,网络交换机通过物理端口状态获知与其连接的终端的链路状态,并按照SW_ALIVE_TIMER设置值周期地广播发送SW_ALIVE_MSG消息,向全网络汇报终端的链路状态信息。NC接收并解析处理该消息,若发现有终端的链路断开,则通过NC_ALIVE_MSG通报全网络,其它终端由此获知NT终端发生故障;(4)NC终端节点故障监控实现方法为:NC按照NC_ALIVE_TIMER设置值周期地广播发送NC_ALIVE_MSG,其中包含NC所维护的全网络状态信息,BNC和NT在收到该消息后,提取全网络状态信息,并清除自身的NC_ALIVE_WDT。当NC终端内部状态监控到故障或者其NIC链路断开等异常情况发生时,其NIC无法按照周期正常发送生命消息。由于在预定的时间内收不到NC_ALIVE_MSG,BNC终端的NC_ALIVE_WDT会首先超时,由此BNC首先感知到NC故障,它代替成为新的NC并周期广播发送NC_ALIVE_MSG消息。其它NT终端收到新的NC_ALIVE_MSG消息后也能获知NC切换的故障处理信息;(5)交换机故障监控方法为:NC接收交换机广播发送的SW_ALIVE_MSG消息后,解析提取终端的链路信息和交换机状态信息,并清除SW_ALIVE_WDT。若SW_ALIVE_WDT超时,则表明交换机发生故障,NC向上层应用上报交换机故障信息。本专利技术具有的优点是:1、提供一种有效的网络故障监控方法,为机载任务系统故障管理提供支撑;2、应用模式灵活、组合性强,支持多层级的网络故障诊断;3、易于实现、扩展性好,适用于不同网络规模的分布式交换网络系统。附图说明图1是机载交换网络拓扑示意图;图2是机载交换网络级故障监控原理示意图。具体实施方式下面结合附图及具体实例对本专利技术做进一步的详细说明。如图2所示,一种机载交换网络故障监控方法基于一组WDT看门狗定时器、一组TIMER周期定时器以及一组网络消息,如表1和表2所示。表1表2表1中所述的看门狗定时器需有硬件支持,定时器可以是硬件逻辑实现的定时器也可以是软件实现的周期任务,网络消息用于实现全网络状态信息的收集和共享。表1中第2列为实际使用中定时器时间设置参考值。表2中网络消息说明如下:由NC负责收集、维护全部网络设备状态信息,并周期广播至网络内所有设备实现全网络状态信息共享。状态信息主要包括两部分:网络终端链路状态,由网络中的交换机按照SW_ALIVE_TIMER(见图2中SW交换机)所设置的值周期地广播发送SW_ALIVE_MSG汇报全网,0代表终端链路断开,1代表终端链路正常;并由NC负责解析和维护;网络终端通信状态,由驱动软件定义的上层状态信息,用以表明终端是否处于可通信状态。定义该状态的原因为,单纯地依靠链路信息,无法判断网络终端的主机CPU是否正常。为此,网络终端在正常初始化完成后,由终端的主机CPU主动地向NC上报状态,NC将该终端的通信状态置为1。NC依据终端的链路状态和通信状态维护网络状态,并按照NC_ALIVE_TIMER(见图2中NC终端)所设置的值周期地广播发送NC_ALIVE_MSG,向全网汇报其收集到的网络状态信息,其它终端只接收并解析获取该信息。一种网络设备故障的监控方法,详细实现过程为:1、终端内部故障监控终端内部状态监控通过HOST与NIC相互获取对方生命信息的方式实现双向健康监控(见图2中的网络终端),此功能适用于所有类型的网络终端,具体实现为:a.HOST设置监控NIC看门狗定时器NIC_ALIVE_WDT;NIC设置监控HOST的看门狗定时器HOST_ALIVE_WDT;b.NIC按照NIC_ALIVE_TIMER设置值周期地清除NIC_ALIVE_WDT;c.HOST按照HOST_ALIVE_TIMER设置值启动周期任务或者定时器周期地清除HOST_ALIVE_WDT;d.本文档来自技高网...
一种机载交换网络设备故障监控方法

【技术保护点】
1.一种机载交换网络设备故障监控方法,其特征是,本方法基于一组WDT看门狗定时器、一组TIMER周期定时器以及一组网络消息,其中,WDT看门狗定时器包括:a.主机健康监控看门狗HOST_ALIVE_WDT;b.通信接口健康监控看门狗NIC_ALIVE_WDT;c.网络管理器健康监控看门狗NC_ALIVE_WDT;d.交换机健康监控看门狗SW_ALIVE_WDT;TIMER周期定时器包括:a.主机周期喂狗定时器HOST_ALIVE_TIMER;b.通信接口周期喂狗定时器NIC_ALIVE_TIMER;c.网络管理器周期喂狗定时器NC_ALIVE_TIMER;d.交换机周期喂狗定时器SW_ALIVE_TIMER;其中,WDT看门狗定时器需有硬件支持,TIMER定时器可以是硬件逻辑实现的定时器也可以是由软件实现的周期任务;网络消息包括:a.交换机链路状态汇报消息SW_ALIVE_MSG;b.网络状态汇报消息NC_ALIVE_MSG;本方法包括以下步骤:(1)通过HOST与NIC相互获取对方生命信息的方式实现终端节点内部健康状态双向监控;(2)NT终端节点HOST故障由终端内部故障监控机制感知,其NIC主动发送通信故障信息至NC,并将自身置为不可通信状态;NC收到该NT终端发送的故障信息后,在下一个广播周期通过NC_ALIVE_MSG通报全网络,其它终端由此获知NT终端发生故障;(3)NT终端节点NIC故障由交换机感知并通报,网络交换机通过物理端口状态获知与其连接的终端的链路状态,并按照SW_ALIVE_TIMER设置值周期地广播发送SW_ALIVE_MSG消息,向全网络汇报终端的链路状态信息;NC接收并解析处理该消息,若发现有终端的链路断开,则通过NC_ALIVE_MSG通报全网络,其它终端由此获知NT终端发生故障;(4)NC终端节点故障监控实现方法为:NC按照NC_ALIVE_TIMER设置值周期地广播发送NC_ALIVE_MSG,其中包含NC所维护的全网络状态信息,BNC和NT在收到该消息后,提取全网络状态信息,并清除自身的NC_ALIVE_WDT;当NC终端内部状态监控到故障或者其NIC链路断开等异常情况发生时,其NIC无法按照周期正常发送生命消息;由于在预定的时间内收不到NC_ALIVE_MSG,BNC终端的NC_ALIVE_WDT会首先超时,由此BNC首先感知到NC故障,它代替成为新的NC并周期广播发送NC_ALIVE_MSG消息;其它NT终端收到新的NC_ALIVE_MSG消息后也能获知NC切换的故障处理信息;(5)交换机故障监控方法为:NC接收交换机广播发送的SW_ALIVE_MSG消息后,解析提取终端的链路信息和交换机状态信息,并清除SW_ALIVE_WDT;若SW_ALIVE_WDT超时,则表明交换机发生故障,NC向上层应用上报交换机故障信息。...

【技术特征摘要】
1.一种机载交换网络设备故障监控方法,其特征是,本方法基于一组WDT看门狗定时器、一组TIMER周期定时器以及一组网络消息,其中,WDT看门狗定时器包括:a.主机健康监控看门狗HOST_ALIVE_WDT;b.通信接口健康监控看门狗NIC_ALIVE_WDT;c.网络管理器健康监控看门狗NC_ALIVE_WDT;d.交换机健康监控看门狗SW_ALIVE_WDT;TIMER周期定时器包括:a.主机周期喂狗定时器HOST_ALIVE_TIMER;b.通信接口周期喂狗定时器NIC_ALIVE_TIMER;c.网络管理器周期喂狗定时器NC_ALIVE_TIMER;d.交换机周期喂狗定时器SW_ALIVE_TIMER;其中,WDT看门狗定时器需有硬件支持,TIMER定时器可以是硬件逻辑实现的定时器也可以是由软件实现的周期任务;网络消息包括:a.交换机链路状态汇报消息SW_ALIVE_MSG;b.网络状态汇报消息NC_ALIVE_MSG;本方法包括以下步骤:(1)通过HOST与NIC相互获取对方生命信息的方式实现终端节点内部健康状态双向监控;(2)NT终端节点HOST故障由终端内部故障监控机制感知,其NIC主动发送通信故障信息至NC,并将自身置为不可通信状态;NC收到该NT终端发送的故障信息后,在下一个广播周期通过NC_ALIVE_MSG通报全网络,其它终端由此获知NT终端发生故障;(3)N...

【专利技术属性】
技术研发人员:王晓华李斌李健李大鹏范祥辉薛威
申请(专利权)人:中国航空工业集团公司西安航空计算技术研究所
类型:发明
国别省市:陕西,61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1