一种报警处理方法、装置及系统制造方法及图纸

技术编号:22024896 阅读:30 留言:0更新日期:2019-09-04 02:04
本发明专利技术公开了一种报警处理方法、装置及系统,此方法包括:接收服务器的上报信息;根据所述上报信息判断所述服务器是否发生故障;在确定所述服务器是否发生故障后,确定所述服务器的故障级别;确定所述故障级别对应的处理方案,执行所述处理方案。本发明专利技术实施例可以自动进行报警处理,反应速度快,可有效减少重大异常造成的影响,并且还可以判断报警级别,根据相应级别及时进行相应的智能处理。

An Alarm Processing Method, Device and System

【技术实现步骤摘要】
一种报警处理方法、装置及系统
本专利技术涉及互联网
,尤其涉及一种报警处理方法、装置及系统。
技术介绍
在互联网公司中,各个大公司的业务平台都是基于大规模集群的,而大规模的集群都是凌驾于成千上万的服务器之上的,如何保障业务平台、大规模集群、成千上万的服务器的安全性和稳定性是维护各个业务顺利进行的最重要环节。现有技术中维护服务器的安全性和稳定性的方案具有以下缺点:1)人力监控无法满足:通过人力监控异常报警的成本巨大,而且在报警信息较多时,短时间内人工无法快速处理。2)解决报警异常的时间较长:从发现告警到找出出现异常的根本原因再到解决此问题所需的时间较长。3)对服务影响大:对于影响范围大或者重大异常,告警处理不智能或者没及时快速移除故障节点的话,对客户服务质量影响巨大。
技术实现思路
为了解决上述技术问题,本专利技术提供了一种报警处理方法、装置及系统。本专利技术提供的故障处理方法,包括:接收服务器的上报信息;根据所述上报信息判断所述服务器是否发生故障;在确定所述服务器是否发生故障后,确定所述服务器的故障级别;确定所述故障级别对应的处理方案,执行所述处理方案。上述故障处理方法还具有以下特点:所述确定所述服务器的故障级别包括以下方式中的一种:一,根据所述上报信息确定所述服务器的故障级别;二,获取所述服务器的运行状态信息,根据所述运行状态信息确定所述服务器的故障级别;三,获取所述服务器的运行状态信息,根据所述上报信息和所述运行状态信息确定所述服务器的故障级别;四,根据获取服务器的运行状态信息是否成功的结果,确定服务器的故障级别。上述故障处理方法还具有以下特点:所述上报信息包括所述服务器所属的用户标识和/或地区,所述确定所述服务器的故障级别后还包括级别修正步骤,包括:判断所述用户标识属于预设用户识合集和/或所述地区属于预设地区时,将所述服务器的故障级别调高。上述故障处理方法还具有以下特点:所述处理方案中包括以下方案中的至少一种:移除所述服务器、通过自动修复方案进行修复、发出告警。上述故障处理方法还具有以下特点:所述故障级别为第一故障级别时,所述第一故障级别对应的处理方案为移除所述服务器和通过第一通信方式发出告警;所述故障级别为第二故障级别时,所述第二故障级别对应的处理方案为通过自动修复方案进行修复和通过第一通信方式发出告警;所述故障级别为第三故障级别时,所述第三故障级别对应的处理方案为通过自动修复方案进行修复和通过第二通信方式发出告警;所述故障级别为第四故障级别时,所述第四故障级别对应的处理方案为通过自动修复方案进行修复;所述第一故障级别至所述第四故障级别的故障严重程度依次降低;所述第一通信方式的紧急程度大于所述第二通信方式的紧急程度。本专利技术提供的故障处理装置,包括:接收模块,用于接收服务器的上报信息;判断模块,用于根据所述上报信息判断所述服务器是否发生故障;确定模块,在确定所述服务器是否发生故障后,确定所述服务器的故障级别;处理模块,用于确定所述故障级别对应的处理方案,执行所述处理方案。上述故障处理装置还具有以下特点:所述确定模块,用于使用以下方式中的一种确定所述服务器的故障级别:一,根据所述上报信息确定所述服务器的故障级别;二,获取所述服务器的运行状态信息,根据所述运行状态信息确定所述服务器的故障级别;三,获取所述服务器的运行状态信息,根据所述上报信息和所述运行状态信息确定所述服务器的故障级别;四,根据获取服务器的运行状态信息是否成功的结果,确定服务器的故障级别。上述故障处理装置还具有以下特点:所述上报信息包括所述服务器所属的用户标识和/或地区;所述装置还包括修正模块,用于判断所述用户标识属于预设用户识合集和/或所述地区属于预设地区时,将所述服务器的故障级别调高。上述故障处理装置还具有以下特点:所述处理方案中包括以下方案中的至少一种:移除所述服务器、通过自动修复方案进行修复、发出告警。上述故障处理装置还具有以下特点:所述故障级别为第一故障级别时,所述第一故障级别对应的处理方案为移除所述服务器和通过第一通信方式发出告警;所述故障级别为第二故障级别时,所述第二故障级别对应的处理方案为通过自动修复方案进行修复和通过第一通信方式或第二通信方式发出告警;所述故障级别为第三故障级别时,所述第三故障级别对应的处理方案为通过自动修复方案进行修复和通过第二通信方式发出告警;所述故障级别为第四故障级别时,所述第四故障级别对应的处理方案为通过自动修复方案进行修复。本专利技术提供的故障处理系统包括:监控平台、调度系统、通知系统、修复系统;所述监控平台,用于接收服务器的上报信息,根据所述上报信息判断所述服务器是否发生故障,在确定所述服务器是否发生故障后,根据所述上报信息确定所述服务器的故障级别;还用于在所述故障级别为第一故障级别时,调用所述调度系统移除所述服务器和调用所述通知系统通过第一通信方式发出告警;还用于在所述故障级别为第二故障级别时,调用所述修复系统通过自动修复方案进行修复和调用所述通知系统通过第一通信方式发出告警;还用于在所述故障级别为第三故障级别时,调用所述修复系统通过自动修复方案进行修复和调用所述通知系统通过第二通信方式发出告警;所述故障级别为第四故障级别时,所述第四故障级别对应的处理方案为调用所述修复系统通过自动修复方案进行修复。本专利技术实施例可以自动进行报警处理,反应速度快,可有效减少重大异常造成的影响,并且还可以判断报警级别,根据相应级别及时进行相应的智能处理。附图说明构成本专利技术的一部分的附图用来提供对本专利技术的进一步理解,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是实施例中报警处理方法的流程图;图2是实施例中报警处理装置的结构图;图3是实施例中报警处理系统的结构图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。图1是实施例中报警处理方法的流程图,此方法包括:步骤1,接收服务器的上报信息;步骤2,根据上报信息判断服务器是否发生故障;步骤3,在确定服务器是否发生故障后,确定服务器的故障级别;步骤4,确定故障级别对应的处理方案,执行此处理方案。其中,步骤1中的上报信息包括以下信息中的至少一种:软件运行状态、服务端口状态、节点网络质量状态(丢包率、延时率)、硬件设备状态(网卡状态、cpu状态、内存状态、磁盘状态)、可服务状态(例如:对外提供正常访问率)、服务器的下载速度(例如:对外的访问下载速率)、服务器负载信息、带宽跑满信息。步骤2中根据上报信息判断服务器是否发生故障包括:判断上报信息中的具体参数值是否超过相应的预设阈值,如果是,则判断服务器是否发生故障。步骤3中确定服务器的故障级别包括以下方式中的一种:一,根据上报信息确定服务器的故障级别;例如,上报信息为丢包率时,丢包率位于2%-5%区间时为第三故障级别,丢包率位于5%-10%区间本文档来自技高网...

【技术保护点】
1.一种故障处理方法,包括:接收服务器的上报信息;根据所述上报信息判断所述服务器是否发生故障;在确定所述服务器是否发生故障后,确定所述服务器的故障级别;确定所述故障级别对应的处理方案,执行所述处理方案。

【技术特征摘要】
1.一种故障处理方法,包括:接收服务器的上报信息;根据所述上报信息判断所述服务器是否发生故障;在确定所述服务器是否发生故障后,确定所述服务器的故障级别;确定所述故障级别对应的处理方案,执行所述处理方案。2.如权利要求1所述的故障处理方法,其特征在于,所述确定所述服务器的故障级别包括以下方式中的一种:一,根据所述上报信息确定所述服务器的故障级别;二,获取所述服务器的运行状态信息,根据所述运行状态信息确定所述服务器的故障级别;三,获取所述服务器的运行状态信息,根据所述上报信息和所述运行状态信息确定所述服务器的故障级别;四,根据获取服务器的运行状态信息是否成功的结果,确定服务器的故障级别。3.如权利要求1所述的故障处理方法,其特征在于,所述上报信息包括所述服务器所属的用户标识和/或地区,所述确定所述服务器的故障级别后还包括级别修正步骤,包括:判断所述用户标识属于预设用户识合集和/或所述地区属于预设地区时,将所述服务器的故障级别调高。4.如权利要求1所述的故障处理方法,其特征在于,所述处理方案中包括以下方案中的至少一种:移除所述服务器、通过自动修复方案进行修复、发出告警。5.如权利要求1或4所述的故障处理方法,其特征在于,所述故障级别为第一故障级别时,所述第一故障级别对应的处理方案为移除所述服务器和通过第一通信方式发出告警;所述故障级别为第二故障级别时,所述第二故障级别对应的处理方案为通过自动修复方案进行修复和通过第一通信方式发出告警;所述故障级别为第三故障级别时,所述第三故障级别对应的处理方案为通过自动修复方案进行修复和通过第二通信方式发出告警;所述故障级别为第四故障级别时,所述第四故障级别对应的处理方案为通过自动修复方案进行修复;所述第一故障级别至所述第四故障级别的故障严重程度依次降低,所述第一通信方式的紧急程度大于所述第二通信方式的紧急程度。6.一种故障处理装置,包括:接收模块,用于接收服务器的上报信息;判断模块,用于根据所述上报信息判断所述服务器是否发生故障;确定模块,在确定所述服务器是否发生故障后,确定所述服务器的故障级别;处理模块,用于确定所述故障级别对应的处理方案,执行所述处理方案。7.如权利要求6所述的故障处理装置,其特征在于,所述确定模块,用...

【专利技术属性】
技术研发人员:谭杰唐磊苗辉
申请(专利权)人:贵州白山云科技股份有限公司
类型:发明
国别省市:贵州,52

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1