一种通信设备机电管理总线故障节点的定位及隔离方法技术

技术编号:13191644 阅读:172 留言:0更新日期:2016-05-11 19:17
本发明专利技术公开了一种通信设备机电管理总线故障节点的定位及隔离方法,包括:运行的SHMC在通信过程中记录机电管理总线通信状态;并对通信状态数据进行统计分析,判断对应总线是否出现通信不可恢复的异常;当出现通信不可恢复的异常,SHMC用正常机电管理总线向挂接在异常机电管理总线上的机电管理节点发送命令,使其控制对应的总线机械开关,协调异常机电管理总线上的各节点之间进行相互的通信测试,定位故障节点,返回故障节点的定位信息;SHMC通过远程网管系统显示机电管理总线异常告警和导致异常的故障节点的定位信息,实现远程告警定位指示。本发明专利技术实现机电管理系统自动发现并定位导致机电管理总线异常故障节点,有效降低维护成本,提高系统可靠性。

【技术实现步骤摘要】

本专利技术涉及通信设备,具体涉及。
技术介绍
随着通信设备容量的逐渐增加,其功耗也不断增加,致使通信设备的供电及散热日趋复杂,为了更好的实现通信设备供电和散热等机电功能,通信设备开始引入机电管理系统,专用于通信设备机电管理。如图1所示,基于机电管理总线的机电管理系统框图,该机电管理系统是基于两路独立硬件的串行总线实现的,如I2C总线和CAN总线,该方案串行总线信号线少,实现方便,通信速度也可以满足机电数据传输的要求。但是串行总线存在单节点失效而影响所有总线节点通信的问题,例如单节点总线接口芯片损坏,对地短路,总线控制器和总线防护电路之间也将不能通信;为增加机电管理系统的可靠性,传统的做法是同时启用两组串行总线,两路总线互为主、备,虽然这样做可以提高总线可用性,但是当一条总线异常时,无法定位和隔离损坏节点,需要人工对通信设备所有的单盘进行排查,不仅造成人力资源浪费,而且会影响设备业务。
技术实现思路
本专利技术所要解决的技术问题是克服现有机电管理系统在机电管理总线通信异常后,无法定位和隔离故障节点的问题。为了解决上述技术问题,本专利技术所采用的技术方案是提供,包括以下步骤:步骤100、运行的SHMC在进行通信的过程中对机电管理总线的通信状态进行记录;步骤200、运行的SHMC对记录的通信状态数据进行统计分析,判断机电管理总线是否出现通信不可恢复的异常;步骤300、当一路机电管理总线出现通信不可恢复的异常时,运行的SHMC使用正常通信的机电管理总线向挂接在异常机电管理总线上的机电管理节点发送命令,使所述机电管理节点控制与其对应的总线机械开关,协调挂接在异常机电管理总线上的各机电管理节点之间进行相互的异常总线通信测试,从而定位异常机电管理总线中的故障节点,并返回故障节点的板盘号和槽位号;步骤400、运行的SHMC通过远程网管接口将机电管理总线异常告警和导致异常的故障节点的板盘号和槽位号发送到远程网管系统进行显示,实现远程告警定位指示。在上述方法中,所述通信状态进行记录的方式为:运行的SHMC每使用机电管理总线发起一次通信,都将根据通信结果的成败,对通信状态变量进行累加操作,所述通信状态变量为连续通信失败次数。在上述方法中,判断机电管理总线出现通信不可恢复的异常的方式为:对记录的通信状态数据变量进行判断,当机电管理总线的通信状态变量连续通信失败次数值达到规定阈值时,判断该机电管理总线出现不可恢复的异常。在上述方法中,所述挂接在异常机电管理总线上的机电管理节点包括IPMC节点和备用SHMC节点。在上述方法中,步骤300具体包括以下步骤:步骤301、当运行的SHMC判断一路机电管理总线发生不可恢复的异常时,该SHMC启动机电管理总线异常定位程序;步骤302、运行的SHMC通过正常通信的机电管理总线向所有连接到异常机电管理总线上的机电管理节点发送总线脱离命令;步骤303、各机电管理节点驱动机械开关断开,从而脱离异常机电管理总线;步骤304、运行的SHMC确认所有机电管理节点脱离异常机电管理总线,并从机电管理节点注册表中选择两个槽位单盘;步骤305、运行的SHMC通过正常机电管理总线向所述单盘发送连接异常机电管理总线命令;步骤306、被选择单盘的IPMC或SHMC驱动机械开关闭合,与异常机电管理总线连接;步骤307、运行的SHMC确认被选择的两个单盘连接到异常机电管理总线后,发送附带其中一个单盘IPMC或SHMC的通信地址信息的通信测试命令给另一单盘的IPMC或SHMC;步骤308、接收到通信测试命令的被选择单盘的IPMC或SHMC向运行的SHMC发送通信测试命令接收应答,并根据通信测试命令中的通信地址信息,通过异常机电管理总线发送测试数据,并等待对方的应答;步骤309、运行的SHMC向发起通信测试的被选择单盘IPMC或SHMC发送通信测试结果获取命令,并接收该被选择单盘IPMC或SHMC与另一被选择单盘IPMC或SHMC通信的应答数据;步骤310、运行的SHMC根据收到的通信测试结果应答数据判断接入异常机电管理总线的两个单盘的IPMC或SHMC之间的机电管理总线电路是否异常,如果通信异常,执行步骤311;否则,执行步骤312;步骤311、运行的SHMC重新在机电管理节点注册表中选择两个单盘,然后执行步骤305;步骤312、运行的SHMC选择通信成功单盘中的一个作为正常节点,对其它的从机电管理节点进行上述通信测试,直到对异常机电管理总线上所有机电管理节点都进行完通信测试,筛选出引起机电管理总线异常的节点。在上述方法中,远程网管系统显示机电管理总线异常告警和导致异常的故障节点的板盘号和槽位号,同时,导致机电管理总线异常的故障节点在本地进行亮灯告警。本专利技术通过为挂接在机电管理总线上的每个机电管理节点串入总线机械开关,使得在两路机电管理总线中的一路总线发生不可恢复异常时,机电管理系统能够通过控制总线机械开关完成每个机电管理节点之间的通信测试,从而实现机电管理系统自动发现机电管理总线通信异常,并定位导致总线异常的机电管理节点进行隔离,不需人工排查,就可以准确定位故障点,不仅有效降低维护中的人力成本,还提高了机电管理系统的可靠性,同时利用远程网络管理系统将导致异常的机电管理节点信息及时反馈给维护人员,方便维护人员做出及时有效的后续维护,解除故障。【附图说明】图1为基于机电管理总线的机电管理系统框图;图2为本专利技术中通信设备的机电管理系统的机电管理节点框图;图3为本专利技术提供的流程图;图4为本专利技术中步骤300的具体流程图。【具体实施方式】下面结合说明书附图和具体实施例对本专利技术做出详细的说明。如图1所示的基于机电管理总线的机电管理系统,该系统的机电管理总线接口电路在靠近背板端,每个机电管理节点没有串入机械开关,当出现总线接口芯片物理层损坏时,无法从总线上脱离出去。而图2为本专利技术中通信设备的机电管理系统的机电管理节点框图,和图1相比较,该系统在各个机电管理节点(包括机箱管理控制器SHMC和智能控制器IPMC)的机电管理总线接口电路靠近背板端串联接入一个受控的机械开关,机械开关受控于IPMC或SHMC,使用常闭触点,在上电及正常情况下,节点挂接于机电管理总线上;SHMC和IPMC可以控制机械开关打开,从而使机电管理节点从物理层上脱离机电管理总线。本专利技术提供的,如图3所示,包括以下步骤:步骤100、运行中的SHMC在使用机电管理总线进行通信的过程中对机电管理总线的通信状态进行记录;通信状态进行记录的方式为:机电管理主节点(正在运行的SHMC)每使用机电管理总线发起一次通信,都将根据本次通信结果的成败,对通信状态变量(连续通信失败次数)进行累加操作。步骤200、运行中的SHMC对记录的机电管理总线通信状态数据进行统计分析,判断机电管理总线是否出现通信不可恢复的异常,即机电管理主节点无法通过该机电管理总线访问挂接在该总线上的任意机电管理从节点,且不可恢复;判断机电管理总线出现通信不可恢复的异常的方式为:对记录的通信状态数据变量进行比较判断,当记录的通信状态数据显示机电管理总线的通信状态变量连续通信失败次数值达到规定阈值时,判断该机电管理总线发生不可恢复的异常。步骤300、当一路机电管理总线出现通信不可恢复的异常时,运行的SHMC上的本文档来自技高网...

【技术保护点】
一种通信设备机电管理总线故障节点的定位及隔离方法,其特征在于,包括以下步骤:步骤100、运行的SHMC在进行通信的过程中对机电管理总线的通信状态进行记录;步骤200、运行的SHMC对记录的通信状态数据进行统计分析,判断机电管理总线是否出现通信不可恢复的异常;步骤300、当一路机电管理总线出现通信不可恢复的异常时,运行的SHMC使用正常通信的机电管理总线向挂接在异常机电管理总线上的机电管理节点发送命令,使所述机电管理节点控制与其对应的总线机械开关,协调挂接在异常机电管理总线上的各机电管理节点之间进行相互的异常总线通信测试,从而定位异常机电管理总线中的故障节点,并返回故障节点的板盘号和槽位号;步骤400、运行的SHMC通过远程网管接口将机电管理总线异常告警和导致异常的故障节点的板盘号和槽位号发送到远程网管系统进行显示,实现远程告警定位指示。

【技术特征摘要】

【专利技术属性】
技术研发人员:刘平雷泽宾刘翠梅宋林胤
申请(专利权)人:烽火通信科技股份有限公司
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1