一种通信设备的业务面和控制面的隐性故障修复方法和装置制造方法及图纸

技术编号:12357959 阅读:73 留言:0更新日期:2015-11-20 13:41
本申请实施例提供了一种通信设备的业务面和控制面的隐性故障修复方法,所述通信设备中包括一个或多个通信组件,所述的方法包括:分别获取通信设备的业务面关键指标KPI,以及,控制面关键指标KPI;根据所述控制面关键指标KPI,确定通信设备中发生控制面隐性故障的一个或多个通信组件;根据所述业务面关键指标KPI,确定通信设备中发生业务面隐性故障的一个或多个通信组件;对所述一个或多个故障的通信组件进行修复。本申请通过通信设备已有的关键指标KPI检测控制面和业务面的隐性故障,不需增加通信设备额外的处理负荷。

【技术实现步骤摘要】

本申请涉及通信设备
,特别是涉及一种通信设备的业务面和控制面的隐 性故障修复方法和一种通信设备的业务面和控制面的隐性故障修复装置。
技术介绍
通信网络设备故障分为显性和隐性,显性故障一般指可通过OMC(Operationand MaintenanceCenter,操作维护中心)网管的告警信息进行监控和管理的诸如心跳检测监 守超时的硬件板卡故障、软件运行异常引起的板卡复位故障,或者传输闪断告警、或者通信 服务单元故障(如通信设备中基站退服、载波故障等)。隐性故障指0MC监控中没有任何设 备故障告警,但设备处于非正常工作状态,对指标产生负面影响和降低用户感知度的故障, 此类故障发生时,用户感觉无法正常呼叫或者进行业务。 隐性故障产生可能由于软件或者硬件产生故障且隐性故障的发生具备随机性。例 如软件长时间运行引起的挂内存、定时器、呼叫逻辑实体等软件资源的情况导致设备不能 正常工作。或者由于设备长时间运行引起的诸如芯片老化、节点虚焊连接异常导致设备不 能正常工作。 这些问题严重影响网络质量和用户感知,因此,隐性问题的主动发现和快速解决, 对于提升用户满意度,保证网络性能,具有非常重要的意义。
技术实现思路
鉴于上述问题,提出了本申请实施例以便提供一种克服上述问题或者至少部分地 解决上述问题的一种通信设备的业务面和控制面的隐性故障修复方法和相应的一种通信 设备的业务面和控制面的隐性故障修复装置。 为了解决上述问题,本申请实施例公开了一种一种通信设备的业务面和控制面的 隐性故障修复方法,其中,所述通信设备中包括一个或多个通信组件,所述的方法包括: 分别获取通信设备的业务面关键指标KPI,以及,控制面关键指标KPI; 根据所述控制面关键指标KPI,确定通信设备中发生控制面隐性故障的一个或多 个通信组件; 根据所述业务面关键指标KPI,确定通信设备中发生业务面隐性故障的一个或多 个通信组件; 对所述一个或多个故障的通信组件进行修复。 优选的,所述通信组件为软件模块、呼叫逻辑实体、硬件板卡本体和/或硬件板卡 物理实体,所述根据所述控制面关键指标KPI,确定通信设备中发生控制面隐性故障的一个 或多个通信组件的步骤包括: 采用所述控制面关键指标KPI确定所述控制面中发生的异常事件; 定位发生所述异常事件的通信组件; 统计所述异常事件发生的次数; 当所述次数满足预设的阈值时,将当前通信组件确定为发生控制面隐性故障的通 信组件。 优选的,所述根据所述业务面关键指标KPI,确定通信设备中发生业务面隐性故障 的一个或多个通信组件的步骤包括: 采用所述业务面关键指标KPI,确定所述业务面中发生的异常事件; 定位发生所述异常事件的通信组件; 统计所述异常事件发生的次数; 当所述次数满足预设的阈值时,将当前通信组件确定为发生业务面隐性故障的通 信组件。 优选的,所述呼叫逻辑实体安装在硬件板卡本体或硬件板卡物理实体; 所述对所述一个或多个故障的通信组件进行修复的步骤包括: 当发生异常事件的通信组件为单个呼叫逻辑实体时,对所述通信组件进行重启; 若重启后所述异常事件仍然存在;则判断所述通信组件是否可以隔离; 若是,则对所述通信进行隔离; 若否,或,若隔离所述通信组件后,所述异常事件仍然存在;则重启所述通信组件 所在的硬件板卡本体或硬件板卡物理实体。 优选的,所述硬件板卡物理实体安装在硬件板卡本体上; 所述对所述一个或多个故障的通信组件进行修复的步骤还包括: 当发生异常事件的通信组件为单个硬件板卡本体或硬件板卡物理实体时,判断所 述通信组件是否可以隔离; 若是,则对所述通信组件进行隔离; 若否,则重启所述通信组件的物理板卡本体或硬件板卡物理实体所在硬件板卡本 体。 优选的,所述对所述一个或多个故障的通信组件进行修复的步骤还包括: 当发生异常事件的通信组件包括:至少一个呼叫逻辑实体,和/或,硬件板卡本 体,和/或,硬件板卡物理实体时,对通信组件进行连通性检测; 判断联通性检测失败的通信组件是否可以隔离; 若是,则对所述联通性检测失败的通信组件进行隔离; 若否,或,若隔离所述联通性检测失败的通信组件后,异常事件仍然存在;则重启 所述联通性检测失败的通信组件中的硬件板卡本体,和/或,呼叫逻辑实体所在的硬件板 卡本体,和/或,硬件板卡物理实体所在的物理板卡本体; 若重启后,异常事件仍然存在,则上报告警进行人力干预。 优选的,所述阈值包括:静态阈值和动态阈值; 所述静态阈值用于判断不随时间周期变化的控制面关键指标KPI或业务面关键 指标KPI所对应的故障通信组件是否发生隐形故障; 所述动态阈值用于判断随时间周期变化的控制面关键指标KPI或业务面关键指 标KPI所对应的故障通信组件是否发生隐形故障。 同时,本申请还公开了一种通信设备的业务面和控制面的隐性故障修复装置,其 中,所述通信设备中包括一个或多个通信组件,所述的装置包括: 获取模块,分别获取通信设备的业务面关键指标KPI,以及,控制面关键指标KPI; 控制面隐性故障确定模块,用于根据所述控制面关键指标KPI,确定通信设备中发 生控制面隐性故障的一个或多个通信组件; 业务面隐性故障确定模块,用于根据所述业务面关键指标KPI,确定通信设备中发 生业务面隐性故障的一个或多个通信组件; 修复模块,用于对所述一个或多个故障的通信组件进行修复。 优选的,所述通信组件为软件模块、呼叫逻辑实体、硬件板卡本体和/或硬件板卡 物理实体;所述控制面隐性故障确定模块进一步包括: 控制面异常事件确定子模块,用于采用所述控制面关键指标KPI确定所述控制面 中发生的异常事件; 控制面异常事件定位子模块,用于定位发生所述异常事件的通信组件; 控制面异常事件统计子模块,用于统计所述异常事件发生的次数; 控制面隐性故障组件确定子模块,用于当所述次数满足预设的阈值时,将当前通 信组件确定为发生控制面隐性故障的通信组件。 优选的,所述业务面隐性故障确定模块进一步包括: 业务面异常事件确定子模块,用于采用所述业务面关键指标KPI,确定所述业务面 中发生的异常事件; 业务面异常事件定位子模块,用于定位发生所述异常事件的通信组件; 业务面异常事件统计子模块,用于统计所述异常事件发生的次数; 业务面隐性故障组件确定子模块,用于当所述次数满足预设的阈值时,将当前通 信组件确定为发生业务面隐性故障的通信组件。 优选的,所述呼叫逻辑实体安装在硬件板卡本体或硬件板卡物理实体; 所述修复模块进一步包括: 第一逻辑重启子模块,用于当发生异常事件的通信组件为单个呼叫逻辑实体时, 对所述通信组件进行重启; 第一判断子模块,用于若重启后所述异常事件仍然存在;则判断所述通信组件是 否可以隔离; 第一隔离子模块,用于若所述第一判断子模块判断结果为是,则对所述通信进行 隔呙; 第一硬件重启子模块,用于若所述第一判断子模块判断结果为否,或,若隔离所述 通信组件后,所述异常事件仍然存在;则重启所述通信组件所在的硬件板卡本体或硬件板 卡物理实体。 优选的,所述硬件板卡物理实体安装在硬件板卡本体上; 所述修复模块还进一步包括: 第二判断子模块,用于当发生异常事件的通信组件为单个硬件板卡本体或硬件板 卡物理实体时,判断所述通信组件是否可以隔离本文档来自技高网...

【技术保护点】
一种通信设备的业务面和控制面的隐性故障修复方法,其特征在于,所述通信设备中包括一个或多个通信组件,所述的方法包括:分别获取通信设备的业务面关键指标KPI,以及,控制面关键指标KPI;根据所述控制面关键指标KPI,确定通信设备中发生控制面隐性故障的一个或多个通信组件;根据所述业务面关键指标KPI,确定通信设备中发生业务面隐性故障的一个或多个通信组件;对所述一个或多个故障的通信组件进行修复。

【技术特征摘要】

【专利技术属性】
技术研发人员:程岳
申请(专利权)人:大唐移动通信设备有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1