一种自监控方法和装置制造方法及图纸

技术编号:20592798 阅读:18 留言:0更新日期:2019-03-16 09:00
本发明专利技术公开了一种自监控方法和装置,该方法包括:利用定时轮询的方式获取预设的监控服务的实时状态;当所述预设的监控服务的状态异常时,对系统日志进行检索并初步分析异常原因;根据初步分析结果执行不同的异常恢复策略。

A Self-monitoring Method and Device

The invention discloses a self-monitoring method and device, which includes: acquiring the real-time status of the preset monitoring service by timing polling; searching the system log and analyzing the causes of the anomaly when the status of the preset monitoring service is abnormal; and implementing different anomaly recovery strategies according to the preliminary analysis results.

【技术实现步骤摘要】
一种自监控方法和装置
本申请涉及计算机
,尤其涉及一种自监控方法和装置。
技术介绍
在云资源管理平台中,存在着大量的虚拟资源或物理设备。数量众多的资源、设备需要统一纳入到平台的管理中,并且要求云资源管理平台可以对其进行实时监控。因此,监控管理模块是云资源管理平台中用于实现监控管理关键的一部分。在云资源管理平台中,一方面,监控管理模块通常利线程或者定时程序去查询资源、设备的状态,其负荷往往较大;另一方面,监控管理服务模块是云资源管理平台中极其重要的一环,对监控管理模块自身的稳定性与健壮性有较高的要求。然而,云资源管理平台中的监控管理模块往往只关注于对其他模块的监控而忽视对自身服务的监控,或者对自身服务出现的问题缺乏相应的有效的快速处理机制。
技术实现思路
本申请的主要目的在于提供一种自监控方法和装置,可以针对云资源管理平台的监控管理进行监控,确保监控管理服务在出现问题时可以快速解决问题或快速报警,使故障能够及时地被发现并恢复,大大提高了系统监控服务的可用性。为了解决上述技术问题,本申请提供了一种自监控方法,包括:利用定时轮询的方式获取预设的监控服务的实时状态;当所述预设的监控服务的状态异常时,对系统日志进行检索并初步分析异常原因;根据初步分析结果执行不同的异常恢复策略。在一个示例性的实施例中,所述根据初步分析结果执行不同的异常恢复策略包括:根据初步分析结果确定异常原因是否为已知原因;当所述异常原因为已知原因时,按照已有的故障解决方案执行异常恢复,记录操作日志;当所述异常原因为未知原因时,查询所述预设的监控服务对应的数据库数据,将用于初步分析的日志数据与查询到的数据库数据结合进行二次分析,根据二次分析结果尝试异常恢复的方式。在一个示例性的实施例中,所述根据二次分析结果尝试异常恢复的方式之后,所述方法还包括:若所述预设的监控服务的状态恢复,则将此次异常的关键信息进行总结得到此次异常的问题描述,将该问题描述以及恢复方式记录到已有的故障解决方案中,并记录操作日志;若尝试恢复方式的次数等于预设的最大次数时,所述预设的监控服务的状态仍异常,则上报告警。在另一个示例性的实施例中,所述根据初步分析结果确定异常原因是否为已知原因包括:将所述初步分析结果与已有的故障解决方案中的异常问题进行比对,若已有的问题解决方案中存在与所述初步分析结果相同的异常问题,则确定该异常原因为已知原因。在另一个示例性的实施例中,所述预设的监控服务包括监控管理服务中的关键服务。为了解决上述问题,本申请还提供了一种自监控装置,包括:存储器和处理器;其中:所述存储器,用于存储用于自监控的程序;所述处理器,用于读取执行所述用于自监控的程序,执行如下操作:利用定时轮询的方式获取预设的监控服务的实时状态;当所述预设的监控服务的状态异常时,对系统日志进行检索并初步分析异常原因;根据初步分析结果执行不同的异常恢复策略。在一个示例性的实施例中,所述根据初步分析结果执行不同的异常恢复策略包括:根据初步分析结果确定异常原因是否为已知原因;当所述异常原因为已知原因时,按照已有的故障解决方案执行异常恢复,记录操作日志;当所述异常原因为未知原因时,查询所述预设的监控服务对应的数据库数据,将用于初步分析的日志数据与查询到的数据库数据结合进行二次分析,根据二次分析结果尝试异常恢复的方式。在一个示例性的实施例中,所述处理器读取执行所述用于自监控的程序,还执行如下操作:所述根据二次分析结果尝试异常恢复的方式之后,若所述预设的监控服务的状态恢复,则将此次异常的关键信息进行总结得到此次异常的问题描述,将该问题描述以及恢复方式记录到已有的故障解决方案中,并记录操作日志;若尝试恢复方式的次数等于预设的最大次数时,所述预设的监控服务的状态仍异常,则上报告警。在另一个示例性的实施例中,所述根据初步分析结果确定异常原因是否为已知原因包括:将所述初步分析结果与已有的故障解决方案中的异常问题进行比对,若已有的问题解决方案中存在与所述初步分析结果相同的异常问题,则确定该异常原因为已知原因。在另一个示例性的实施例中,所述预设的监控服务包括监控管理服务中的关键服务。综上,根据本专利技术实施例的自监控方法和装置,利用定时轮询的方式获取预设的监控服务的实时状态;当所述预设的监控服务的状态异常时,对系统日志进行检索并初步分析异常原因;根据初步分析结果执行不同的异常恢复策略。本专利技术实施例的自监控方法可以确保监控管理服务在出现问题时可以快速解决问题或快速报警,使故障能够及时地被发现并恢复,大大提高了系统监控服务的可用性。附图说明图1为本专利技术实施例的自监控方法的流程图。图2为本专利技术实施例的自监控装置的结构示意图。图3为本专利技术的一个具体应用示例的自监控方法的流程图。具体实施方式为使本申请的目的、技术方案和优点更加清楚明白,下文中将结合附图对本申请的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。图1是本专利技术实施例的自监控方法的流程图。根据图1的流程图,本实施例的自监控方法包括以下步骤:步骤S1:利用定时轮询的方式获取预设的监控服务的实时状态。步骤S2:当所述预设的监控服务的状态异常时,对系统日志进行检索并初步分析异常原因。步骤S3:根据初步分析结果执行不同的异常恢复策略。在一个示例性的实施例中,用于定时轮询的第一定时器可以根据预设的监控服务的特点来设置,或者根据用户的需求来设置,或者根据当前云平台的运行参数并结合用户的需求来设置。其中,预设的监控服务可以是一个或多个,定时轮询的第一定时器也可以是一个或多个,多个定时器设置的时间值可以不同。本申请对用于定时轮询的第一定时器的设置和预设的监控服务的数目不做具体限定。在一个示例性的实施例中,根据初步分析结果执行不同的异常恢复策略包括:根据初步分析结果确定异常原因是否为已知原因;当所述异常原因为已知原因时,按照已有的故障解决方案执行异常恢复,记录操作日志;当所述异常原因为未知原因时,查询所述预设的监控服务对应的数据库数据,将用于初步分析的日志数据与查询到的数据库数据结合进行二次分析,根据二次分析结果尝试异常恢复的方式。在一个示例性的实施例中,在进行二次分析时,可以启动用于二次分析的第二定时器,若第二定时器超时,仍没有得到二次分析结果,则将重启异常的服务作为异常恢复的方式,并记录二次分析超时。在一个示例性的实施例中,在尝试异常恢复的方式之后,所述方法还包括:若所述预设的监控服务的状态恢复,则将此次异常的关键信息进行总结得到此次异常的问题描述,将该问题描述以及恢复方式记录到已有的故障解决方案中,并记录操作日志;若尝试恢复方式的次数等于预设的最大次数时,所述预设的监控服务的状态仍异常,则上报告警。在一个示例性的实施例中,预设的最大次数可以是1。在另一个示例性的实施例中,当预设的监控服务为多个时,不同的预设的监控服务对应的预设的最大次数可以不同。在一个示例性的实施例中,当预设的监控服务为多个时,可以对预设的监控服务进行分级。例如,可以分为高、中、低三个优先级,不同的优先级的预设的监控服务可以对应不同的最大次数。在一个具体的例子中,高优先级的预设的监控服务对应的最大次数可以为2,低优先级的预设的监控服务对应的最大次数可以本文档来自技高网...

【技术保护点】
1.一种自监控方法,包括:利用定时轮询的方式获取预设的监控服务的实时状态;当所述预设的监控服务的状态异常时,对系统日志进行检索并初步分析异常原因;根据初步分析结果执行不同的异常恢复策略。

【技术特征摘要】
1.一种自监控方法,包括:利用定时轮询的方式获取预设的监控服务的实时状态;当所述预设的监控服务的状态异常时,对系统日志进行检索并初步分析异常原因;根据初步分析结果执行不同的异常恢复策略。2.如权利要求1所述的方法,其特征在于,所述根据初步分析结果执行不同的异常恢复策略包括:根据初步分析结果确定异常原因是否为已知原因;当所述异常原因为已知原因时,按照已有的故障解决方案执行异常恢复,记录操作日志;当所述异常原因为未知原因时,查询所述预设的监控服务对应的数据库数据,将用于初步分析的日志数据与查询到的数据库数据结合进行二次分析,根据二次分析结果尝试异常恢复的方式。3.如权利要求2所述的方法,其特征在于,所述根据二次分析结果尝试异常恢复的方式之后,所述方法还包括:若所述预设的监控服务的状态恢复,则将此次异常的关键信息进行总结得到此次异常的问题描述,将该问题描述以及恢复方式记录到已有的故障解决方案中,并记录操作日志;若尝试恢复方式的次数等于预设的最大次数时,所述预设的监控服务的状态仍异常,则上报告警。4.如权利要求2所述的方法,其特征在于,所述根据初步分析结果确定异常原因是否为已知原因包括:将所述初步分析结果与已有的故障解决方案中的异常问题进行比对,若已有的问题解决方案中存在与所述初步分析结果相同的异常问题,则确定该异常原因为已知原因。5.如权利要求1-4任一项所述的方法,其特征在于,所述预设的监控服务包括监控管理服务中的关键服务。6.一种自监控装置,包括:存储器和处理器;其中:所述存储器,用于存储用于自监控的...

【专利技术属性】
技术研发人员:刘元松
申请(专利权)人:郑州云海信息技术有限公司
类型:发明
国别省市:河南,41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1