The invention relates to a maintenance system of automatic fault diagnosis method and system, which comprises the following steps: step S1, operation information related parameters from the normal operation of the operation and maintenance of the system; step S2, establish the operation fault judgment operation system parameters related to abnormal operation; step S3, operation related information collection operation parameters in the running of the system step S4; operation system of fault fault identification and closing procedures. Automatic fault diagnosis method and system operation and maintenance system provided by the invention are fully detected by the abnormal state of interface for communication operation may exist in the running of the system, disconnect the interface program stuck, interface program error, any of the 3 kinds of detection methods to detect the fault information, namely close interface program, and then restart the program interface in order to ensure the normal operation of the system.
【技术实现步骤摘要】
一种运维系统故障自动诊断方法及系统
本专利技术属于系统运营维护
,尤其涉及一种运维系统故障自动诊断方法及系统。
技术介绍
有效的运维系统应能充分了解业务资源的使用状况,及时发现可能导致系统故障的隐患,是实现系统运营保障的关键。针对现有的运维系统在运行过程中接口程序产生未知的故障,不能自行修复的错误导致接口卡死、崩溃等导致系统无法正常获取数据而无法正常运行的问题。现有系统的检测办法是,采集服务检测接口程序和采集服务之间的标准通讯协议的连接状态。但此方式的缺点是如果程序卡死或者发生错误的时候无法获取反馈状态,这样就无法准确判断程序的状态,本方法将解决在标准的通讯协议无法检测程序状态的情况下也可以检测接口程序运行的状态。
技术实现思路
本专利技术的目的是提供一种运维系统故障自动诊断方法及系统,即在多种检测并行方式并用的基础上,对运维系统运行故障进行故障识别及修复,以保证接口程序的正常运行。为了解决上述技术问题,本专利技术提供了一种运维系统故障自动诊断方法,包括如下步骤:步骤S1,获得运维系统正常运行的相关参数的运行信息;步骤S2,建立运维系统运行故障时相关参数运行异常的判断依据;步骤S3,采集运维系统运行中相关参数的运行信息;步骤S4,对运维系统运行故障进行故障识别及关闭相关程序。进一步可选的,所述相关参数包括被监测的接口程序与采集服务之间的通讯协议连接的状态、被监测的接口程序的内存使用状态,以及操作系统的系统事件。进一步,所述步骤S3包括并行采用的3种相关参数的采集方式,包括;采用定时轮询的方式,采集被监测的接口程序与采集服务之间的通讯协议的连接状态,获取接 ...
【技术保护点】
一种运维系统故障自动诊断方法,其特征在于,包括如下步骤:步骤S1,获得运维系统正常运行的相关参数的运行信息;步骤S2,建立运维系统运行故障时相关参数运行异常的判断依据;步骤S3,采集运维系统运行中相关参数的运行信息;步骤S4,对运维系统运行故障进行故障识别及关闭相关程序。
【技术特征摘要】
1.一种运维系统故障自动诊断方法,其特征在于,包括如下步骤:步骤S1,获得运维系统正常运行的相关参数的运行信息;步骤S2,建立运维系统运行故障时相关参数运行异常的判断依据;步骤S3,采集运维系统运行中相关参数的运行信息;步骤S4,对运维系统运行故障进行故障识别及关闭相关程序。2.根据权利要求1所述的运维系统故障自动诊断方法,其特征在于,所述相关参数包括被监测的接口程序与采集服务之间的通讯协议连接的状态、被监测的接口程序的内存使用状态,以及操作系统的系统事件。3.根据权利要求2所述的运维系统故障自动诊断方法,其特征在于,所述步骤S3包括并行采用的3种相关参数的采集方式,包括:采用定时轮询的方式,采集被监测的接口程序与采集服务之间的通讯协议的连接状态,获取接口程序的通讯是否断开的信息;实时采集被监测的接口程序的内存使用状态,以设定的时间为单位获取当前的内存使用量,将每一设定的时间的内存使用量和上一设定的时间的内存使用量进行对比,以获取接口程序是否卡死的信息;采用定时轮询的方式,采集操作系统的系统事件,以获取接口程序是否存在报错事件的信息。4.根据权利要求1所述的运维系统故障自动诊断方法,其特征在于,所述相关参数包括被监测的接口程序与采集服务之间的通讯协议连接的状态、被监测的接口程序的CPU利用率,以及操作系统的系统事件。5.根据权利要求4所述的运维系统故障自动诊断方法,其特征在于,所述步骤S3包括并行采用的3种相关参数的采集方式,包括:采用定时轮询的方式,采集被监测的接口程序与采集服务之间的通讯协议的连接状态,获取接口程序的通讯是否断开的信息;实时采集被监测的接口程序的CPU利用率,以设定的时间为单位获取当前的CPU利用率,将每一设定的时间的CPU利用率和上一设定的时间的CPU利用率进行对比,以获取接口程序是否卡死的信息;采用定时轮询的方式,采集操作系统...
【专利技术属性】
技术研发人员:韩振华,曾尔阳,胡卓毅,戴斌,
申请(专利权)人:深圳新基点智能股份有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。