一种终端设备本地故障识别方法及系统技术方案

技术编号:21796397 阅读:29 留言:0更新日期:2019-08-07 09:52
本发明专利技术公开了一种终端设备本地故障识别方法及系统,包括步骤1:实时获取终端设备中各个模块的状态特征码来监测模块状态是否发生变化,若发生变化,执行步骤2;步骤2:对状态发生变化的模块进行稳定性检测;其中,判断模块变化后的状态是否至少持续了一个稳定性检测周期,若是,检测通过并执行步骤3;步骤3:依据预设故障过滤表、故障分级表以及单模块识别策略判断步骤2中检测通过的各个模块的滤波状态;步骤4:依据预设多模块叠加故障策略以及步骤3检测出的状态为正常状态、故障状态的模块来识别终端设备的叠加状态,并依据终端设备的叠加状态采集故障现场信息来生成报障信息或消除当前存储的报障信息。本发明专利技术提供了故障识别可靠度。

A Local Fault Recognition Method and System for Terminal Equipment

【技术实现步骤摘要】
一种终端设备本地故障识别方法及系统
本专利技术属于故障信息处理
,具体涉及一种终端设备本地故障识别方法及系统。
技术介绍
随着信息化发展和各行业服务效率需求不断提高,智能终端设备产品已开始大规模进入众多消费和社会服务领域,涉及金融、电信、医疗、交通等多个行业和领域。智能终端设备发生故障时,客户通常通过拨打客服热线电话的报修方式向设备厂商报修,客户对问题的描述大多主观性强,缺乏故障信息发生的上下文信息,因此导致对故障定位不够准确,引发设备运维成本高、维修效率低、客户满意度低等问题。对于传统的IT运维系统或监控,目前更多是以实时设备状态进行预警,自动故障识别机制策略简单,模块瞬时故障、通讯类短暂故障、或模块可自恢复的故障等未作滤波,直接生成工单报障容易引起误报,产生的派单取消率高等问题;另外同时工程师维修也缺少必要故障诊断数据和现场辅助工具,诊断手段的自动化程度较低,导致远程解决问题率低,维修效率不高。因此,针对现有技术中故障定位不够准确的问题,有必要提供一种终端设备本地故障识别方法及系统,能够实现故障精确定位,反馈可靠性更高的故障数据以及诊断信息,提升报障精准度,减少故障误报、漏报、重复报障;有效解决终端设备运维问题。
技术实现思路
本专利技术的目的是提供一种终端设备本地故障识别方法及系统,可以提高故障定位精度,反馈可靠性更高的故障数据以及诊断信息,提升报障精准度,减少故障误报、漏报、重复报障。一方面,本专利技术提供一种终端设备本地故障识别方法,包括如下步骤:步骤1:实时获取终端设备中各个模块的状态特征码,并依据所述状态特征码监测模块状态是否发生变化,若发生变化,执行步骤2,若未变化,重复步骤1;步骤2:对状态发生变化的模块进行稳定性检测;其中,判断模块变化后的状态是否持续了一个以上稳定性检测周期,若是,检测通过并执行步骤3;若不是,检测未通过,重复步骤2;步骤3:依据预设故障过滤表、故障分级表以及单模块识别策略判断步骤2中检测通过的各个模块的滤波状态;其中,所述滤波状态包括正常状态、故障待确认状态、故障状态以及故障待恢复状态;步骤4:依据预设多模块叠加故障策略以及步骤3检测出状态为正常状态、故障状态的模块来识别终端设备的叠加状态,并依据终端设备的叠加状态采集故障现场信息来生成报障信息或消除当前存储的报障信息;其中,所述终端设备的叠加状态是将状态为正常状态以及故障状态的所有模块进行叠加,识别获取的所述终端的叠加状态是基于所述预设多模块叠加故障策略将所述终端设备最新记录的叠加状态依据步骤3检测出模块状态来转变的,所述叠加状态的类型分为:无故障状态、第一叠加故障状态A、第二叠加故障状态B、叠加故障恢复状态以及叠加故障正常预备状态;所述第一叠加故障状态A、第二叠加故障状态B中存在状态为故障状态的模块;所述叠加故障恢复状态、叠加故障正常预备状态、无故障状态中所有模块均为正常状态;其中,报障信息至少包括故障模块的故障现场信息以及故障模块的状态特征码。步骤1是通过监控硬件驱动服务SP(ServiceProvider)的状态改变事件来获取特征状态码,其中状态改变事件中包含特征状态码。通过特征状态码可以识别模块处于正常或非正常状态以及识别非正常状态下的不同故障状态,其中模块在非正常和正常之间的转换以及在非正常的不同故障状态下的转换都视为模块瞬时状态的变化。步骤2进行稳定性检测可以滤出瞬时状态噪声,获取当前终端设备真实的状态信息,提高报障可靠性。步骤4是基于终端设备常常同时出现多个模块故障,故将不同检测时间点出现的模块故障进行叠加报障,集中在一个报障信息中进行集中报障,有效降低了故障的漏报、误报的发生几率,即可以理解叠加状态包含的所有模块的正常状态以及故障状态是可在不同检测时间点检测的。同时生成的报障信息包括多维度的信息,例如故障现场信息、故障模块信息,其中故障现场信息包括设备唯一标识、设备主应用程序和设备驱动依赖的软件版本信息、操作系统基本信息、基础硬件信息等信息。故障模块信息包括模块的特征状态码,模块的状态信息等。进一步优选,所述多模块叠加故障策略中设有叠加状态识别策略,所述叠加状态识别策略包括如下规则:a:无故障状态识别规则为:满足a1或a2条件,记录所述终端设备为无故障状态:a1:所述终端设备从未出现故障;a2:所述终端设备最新记录的叠加状态为叠加故障正常预备状态,且在一个完全恢复正常检测周期的期间内步骤3中并检测到故障模块;b:第一叠加故障状态A识别规则为:b1:所述终端设备最新记录的叠加状态为无故障状态时,且步骤3中存在模块为故障状态,则记录所述终端设备为第一叠加故障状态A;b2:所述终端设备最新记录的叠加状态为第一叠加故障状态A时,且第一叠加故障状态A中部分模块状态被步骤3检测出为正常状态,以及步骤3中不存在模块为故障状态,则记录所述终端设备为新的第一叠加故障状态A;b3:所述终端设备最新记录的叠加状态为叠加故障恢复状态或者叠加故障正常预备状态,且叠加故障恢复状态或爹加故障正常预备状态是由第一故障叠加状态A转变而来时,且第一故障叠加状态A涵盖步骤3中所有模块的故障状态,则记录所述终端设备为第一故障叠加状态A;c:第二叠加故障状态B的识别规则为:c1:所述终端设备最新记录的叠加状态为第一叠加故障状态A时,且第一叠加故障状态A未全部包含步骤3中检测出的所有模块的故障状态,则记录所述终端设备为第二叠加故障状态B;c2:所述终端设备最新记录的叠加状态为第二叠加故障状态B时,且第二叠加故障状态B时中部分模块被步骤3检测出转为正常状态,则记录所述终端设备为新的第二叠加故障状态B;c3:所述终端设备最新记录的叠加状态为叠加故障恢复状态或者叠加故障正常预备状态时,且步骤3中存在模块为故障状态且不满足b3条件,则记录所述终端设备为新的第二叠加故障状态B;d:叠加故障恢复状态的识别规则为:d1:所述终端设备最新记录的叠加状态为第一叠加故障状态A或第二叠加故障状态B时,且第一叠加故障状态A或第二叠加故障状态B中故障模块均被步骤3检测出为正常状态时,所述终端设备为叠加故障恢复状态;e:叠加故障正常预备状态的识别规则为:e1:所述终端设备最新记录的叠加状态为叠加故障恢复状态,并在一个叠加故障恢复检测周期内步骤3中并未得到故障模块,所述终端设备为叠加故障正常预备状态。终端设备的叠加状态是随着模块状态的变化而变化,其中,终端设备最初的叠加状态为无故障状态,也未产生报障信息,此时对应上述规则a1;其次当检测到任意模块发生故障时,终端设备的叠加状态则转变为第一叠加故障状态A,同时会生成报障信息Q,此时对应上述规则b1;而当终端设备的叠加状态处于第一叠加故障状态A时,若模块状态变化,其中叠加故障状态A中包含的部分模块检测到故障状态暂时转变为正常,但并非所有模块的状态转变为正常且未新增新的故障模块时,设备状态保持为叠加故障状态A,此时对应上述规则b2;若当终端设备的叠加状态处于第一叠加故障状态A时,若模块状态变为故障状态,且该故障状态不在于第一叠加故障状态A中,终端设备转为第二叠加故障状态B,此时对应上述规则c1;当终端设备为第二叠加故障状态B时,若模块状态变化,其中第二叠加故障状态B中包含的部分模块检测到故障状态暂时转变为正常,但并非所有本文档来自技高网...

【技术保护点】
1.一种终端设备本地故障识别方法,其特征在于,包括如下步骤:步骤1:实时获取终端设备中各个模块的状态特征码,并依据所述状态特征码监测模块状态是否发生变化,若发生变化,执行步骤2,若未变化,重复步骤1;步骤2:对状态发生变化的模块进行稳定性检测;其中,判断模块变化后的状态是否持续了一个以上的稳定性检测周期,若是,检测通过并执行步骤3;若不是,检测未通过,重复步骤2;步骤3:依据预设故障过滤表、故障分级表以及单模块识别策略判断步骤2中检测通过的各个模块的滤波状态;其中,所述滤波状态包括正常状态、故障待确认状态、故障状态以及故障待恢复状态;步骤4:依据预设多模块叠加故障策略以及步骤3检测出状态为正常状态、故障状态的模块来识别终端设备的叠加状态,并依据终端设备的叠加状态采集故障现场信息来生成报障信息或消除当前存储的报障信息;其中,所述终端设备的叠加状态是将状态为正常状态以及故障状态的所有模块进行叠加,识别获取的所述终端的叠加状态是基于所述预设多模块叠加故障策略将所述终端设备最新记录的叠加状态依据步骤3检测出模块状态来转变的,所述叠加状态的类型分为:无故障状态、第一叠加故障状态A、第二叠加故障状态B、叠加故障恢复状态以及叠加故障正常预备状态;所述第一叠加故障状态A、第二叠加故障状态B中存在状态为故障状态的模块;所述叠加故障恢复状态、叠加故障正常预备状态、无故障状态中所有模块均为正常状态;其中,报障信息至少包括故障模块的故障现场信息以及故障模块的状态特征码。...

【技术特征摘要】
1.一种终端设备本地故障识别方法,其特征在于,包括如下步骤:步骤1:实时获取终端设备中各个模块的状态特征码,并依据所述状态特征码监测模块状态是否发生变化,若发生变化,执行步骤2,若未变化,重复步骤1;步骤2:对状态发生变化的模块进行稳定性检测;其中,判断模块变化后的状态是否持续了一个以上的稳定性检测周期,若是,检测通过并执行步骤3;若不是,检测未通过,重复步骤2;步骤3:依据预设故障过滤表、故障分级表以及单模块识别策略判断步骤2中检测通过的各个模块的滤波状态;其中,所述滤波状态包括正常状态、故障待确认状态、故障状态以及故障待恢复状态;步骤4:依据预设多模块叠加故障策略以及步骤3检测出状态为正常状态、故障状态的模块来识别终端设备的叠加状态,并依据终端设备的叠加状态采集故障现场信息来生成报障信息或消除当前存储的报障信息;其中,所述终端设备的叠加状态是将状态为正常状态以及故障状态的所有模块进行叠加,识别获取的所述终端的叠加状态是基于所述预设多模块叠加故障策略将所述终端设备最新记录的叠加状态依据步骤3检测出模块状态来转变的,所述叠加状态的类型分为:无故障状态、第一叠加故障状态A、第二叠加故障状态B、叠加故障恢复状态以及叠加故障正常预备状态;所述第一叠加故障状态A、第二叠加故障状态B中存在状态为故障状态的模块;所述叠加故障恢复状态、叠加故障正常预备状态、无故障状态中所有模块均为正常状态;其中,报障信息至少包括故障模块的故障现场信息以及故障模块的状态特征码。2.根据权利要求1所述的方法,其特征在于:所述多模块叠加故障策略中设有叠加状态识别策略,所述叠加状态识别策略包括如下规则:a:无故障状态识别规则为:满足a1或a2条件,记录所述终端设备为无故障状态;a1:所述终端设备从未出现故障;a2:所述终端设备最新记录的叠加状态为叠加故障正常预备状态,且在一个完全恢复正常检测周期的期间内步骤3中并未检测到故障模块;b:第一叠加故障状态A识别规则为:b1:所述终端设备最新记录的叠加状态为无故障状态时,且步骤3中存在模块为故障状态,则记录所述终端设备为第一叠加故障状态A;b2:所述终端设备最新记录的叠加状态为第一叠加故障状态A时,且第一叠加故障状态A中部分模块状态被步骤3检测出为正常状态,以及步骤3中不存在模块为故障状态,则记录所述终端设备为新的第一叠加故障状态A;b3:所述终端设备最新记录的叠加状态为叠加故障恢复状态或者叠加故障正常预备状态,且叠加故障恢复状态或叠加故障正常预备状态是由第一故障叠加状态A转变时,且第一故障叠加状态A涵盖步骤3中所有模块的故障状态,则记录所述终端设备为第一故障叠加状态A;c:第二叠加故障状态B的识别规则为:c1:所述终端设备最新记录的叠加状态为第一叠加故障状态A时,且第一叠加故障状态A未全部包含步骤3中检测出的所有模块的故障状态,则记录所述终端设备为第二叠加故障状态B;c2:所述终端设备最新记录的叠加状态为第二叠加故障状态B时,且第二叠加故障状态B中部分模块被步骤3检测出转为正常状态,则记录所述终端设备为新的第二叠加故障状态B;c3:所述终端设备最新记录的叠加状态为叠加故障恢复状态或者叠加故障正常预备状态时,且步骤3中存在模块为故障状态且不满足b3条件,则记录所述终端设备为新的第二叠加故障状态B;d:叠加故障恢复状态的识别规则为:d1:所述终端设备最新记录的叠加状态为第一叠加故障状态A或第二叠加故障状态B时,且第一叠加故障状态A或第二叠加故障状态B中故障模块均被步骤3检测出为正常状态,则记录所述终端设备为叠加故障恢复状态;e:叠加故障正常预备状态的识别规则为:e1:所述终端设备最新记录的叠加状态为叠加故障恢复状态时,且在一个叠加恢复正常检查周期内步骤3中并未得到故障模块,则记录所述终端设备为叠加故障正常预备状态。3.根据权利要求1所述的方法,其特征在于:步骤4中依据终端设备的叠加状态采集故障现场信息来生成报障信息或消除预存的报障信息的过程如下:f1:所述终端设备的叠加状态为第一叠加故障状态A或第二叠加故障状态B时,执行过程如下:首先判断当前是否已存储报障信息,若未存储,采集第一叠加故障状态A或第二叠加故障状态B中与故障模块相关联的故障现场信息,依据故障现场信息以及所述第一叠加故障状态A或第二叠加故障状态B中的故障模块来生成报障信息;若已存储,再识别存储的报障信息是否涵盖第一叠加故障状态A或第二叠加故...

【专利技术属性】
技术研发人员:唐嵩廖馥旋熊淑华
申请(专利权)人:中电长城长沙信息技术有限公司
类型:发明
国别省市:湖南,43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1