一种告警管理系统和方法技术方案

技术编号:37998290 阅读:9 留言:0更新日期:2023-06-30 10:12
本申请提供一种告警管理系统,包括服务器,用于上报并呈现绝对预故障告警,抑制相对预故障告警;绝对预故障告警为多个预故障告警中首次产生的告警;相对预故障告警为多个预故障告警中在后产生的告警;抑制为上报、记录但不呈现;服务器包括:多个硬盘驱动器,用于上报多个预故障信息;多个预故障信息中第一预故障信息先于第二预故障信息上报;多个硬盘驱动器为同型号或同批次;带内管理软件上报多个预故障信息;带外管理软件确定第一预故障信息为绝对预故障告警;至少一个第二预故障信息为相对预故障告警。预故障告警。预故障告警。

【技术实现步骤摘要】
一种告警管理系统和方法


[0001]本专利技术涉及服务器管理领域,尤其涉及告警管理系统和方法。

技术介绍

[0002]在服务器集中管理背景下,一个机房或服务器中心会有大量相同配置的服务器,这些服务器运行类似或相同的业务。在同等业务运行场景下服务器出现的故障问题,常常是类似的。
[0003]如果一批次或相同业务的多个服务器上报相同或类似的告警,可能会被厂家或客户认为是硬件问题,通过批量返还故障硬件来解决。然而如果这些告警为误告警,或者可以通过某些简单方法解决,那批量返还硬件的解决方式会引起客户质疑甚至恐慌,可能引起客户对服务器的质量的不满。

技术实现思路

[0004]为了解决上述的问题,本申请的实施例提供了一种告警管理系统和方法。
[0005]第一方面,本申请实施例提供一种告警管理系统,系统包括:服务器;服务器包括:多个硬盘驱动器,用于上报多个预故障信息;多个硬盘驱动器为同型号或同批次;带内管理模块,设置于服务器的操作系统内,带内管理模块用于获得多个预故障信息;上报多个预故障信息;在多个预故障信息中第一预故障信息先于至少一个第二预故障信息上报;至少一个第二预故障信息和第一预故障信息为同类预故障;带外管理模块,设置于服务器的操作系统外;带外管理模快用于获得第一预故障信息和至少一个第二预故障信息,确定第一预故障信息为绝对预故障告警;至少一个第二预故障信息为相对预故障告警;绝对预故障告警为多个预故障信息中首次产生的告警;相对预故障告警为多个预故障信息中在后产生的告警;服务器上报并呈现绝对预故障告警,抑制相对预故障告警;抑制为上报、记录但不呈现。以此,可以将服务器层级的多个硬件上报的相同或类似的告警中首次产生的告警显示出来,其它类似的告警抑制不显示,以简单方法解决相同或类似的告警,可以避免批量返还故障硬件,不会引起客户质疑和恐慌,提升客户对服务器的质量的满意度。
[0006]在一些可以实现的实施方式中,系统还包括:集中管理模块,用于获取并保存多个服务器上报的多个预故障告警,确定多个预故障告警中的绝对预故障告警和相对预故障告警;上报呈现绝对预故障告警,抑制相对预故障告警,多个服务器配置相同。可以在服务器集群层级将多个硬件上报的相同或类似的告警中首次产生的告警显示出来,其它类似的告警抑制不显示,以简单方法解决相同或类似的告警,可以避免批量返还故障硬件,不会引起客户质疑和恐慌,提升客户对服务器的质量的满意度。
[0007]在一些可以实现的实施方式中,系统还包括:云管理模块,用于管理一个或多个集中管理模块,获取并保存多个集中管理模块上报的多个预故障告警,确定多个预故障告警中的绝对预故障告警和相对预故障告警;上报呈现绝对预故障告警,抑制相对预故障告警。以此,可以在云管理平台层级将一批次或相同业务的多个服务器集群上报的相同或类似的
告警中首次产生的告警显示出来,其它类似的告警抑制不显示,可以避免批量返还故障硬件,以简单方法解决相同或类似的告警,那不会引起客户质疑和恐慌,提升客户对服务器的质量的满意度。
[0008]第二方面,本申请实施例提供一种告警管理方法,基于第一方面任意一实施方式的告警管理系统实现,方法包括:服务器的带内管理软件获得多个硬盘驱动器上报的多个预故障信息;上报多个预故障信息;在多个预故障信息中第一预故障信息先于至少一个第二预故障信息上报;至少一个第二预故障信息和第一预故障信息为同类预故障;服务器的带外管理软件获得第一预故障信息和至少一个第二预故障信息,确定第一预故障信息为绝对预故障告警;至少一个第二预故障信息为相对预故障告警;绝对预故障告警为多个预故障信息中首次产生的告警;相对预故障告警为多个预故障信息中在后产生的告警;服务器上报并呈现绝对预故障告警,抑制相对预故障告警;抑制为上报、记录但不呈现。其有益效果如第一方面所述,此处不再赘述。
[0009]在一些可以实现的实施方式中,方法还包括:集中管理软件获取并保存多个服务器上报的多个预故障告警;多个预故障告警为多个服务器中的多个硬盘驱动器上报的预故障告警;根据多个预故障告警获得的先后,确定多个预故障告警中的绝对预故障告警和相对预故障告警;上报呈现绝对预故障告警,抑制相对预故障告警。
[0010]在一些可以实现的实施方式中,方法还包括:云管理软件获取并保存多个集中管理软件上报的多个预故障告警,确定多个预故障告警中的绝对预故障告警和相对预故障告警;上报呈现绝对预故障告警,抑制相对预故障告警。
附图说明
[0011]为了更清楚地说明本说明书披露的多个实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书披露的多个实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
[0012]下面对实施例或现有技术描述中所需使用的附图作简单地介绍。
[0013]图1为本申请实施例提供的告警管理系统的架构示意图;
[0014]图2为本申请实施例1提供的告警管理系统的单机架构示意图;
[0015]图3为本申请实施例1提供的告警管理系统单机的交互机制示意图;
[0016]图4为本申请实施例2提供的告警管理系统的集群架构示意图;
[0017]图5为本申请实施例2提供的告警管理系统的集群交互机制示意图;
[0018]图6为本申请实施例3提供的告警管理系统云管平台的架构图;
[0019]图7为本申请实施例3提供的告警管理系统云管平台的交互机制示意图。
具体实施方式
[0020]为了使本申请实施例的目的、技术方案和优点更加清楚,下面将结合附图,对本申请实施例中的技术方案进行描述。
[0021]在本申请实施例的描述中,“示例性的”、“例如”或者“举例来说”等词用于表示作例子、例证或说明。本申请实施例中被描述为“示例性的”、“例如”或者“举例来说”的任何实
施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”、“例如”或者“举例来说”等词旨在以具体方式呈现相关概念。
[0022]在本申请实施例的描述中,术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,单独存在B,同时存在A和B这三种情况。另外,除非另有说明,术语“多个”的含义是指两个或两个以上。例如,多个系统是指两个或两个以上的系统,多个终端是指两个或两个以上的终端。
[0023]此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
[0024]在本申请实施例的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种告警管理系统,其特征在于,所述系统包括:服务器;所述服务器包括:多个硬盘驱动器,用于上报多个预故障信息;所述多个硬盘驱动器为同型号或同批次;带内管理模块,设置于服务器的操作系统内,所述带内管理模块用于获得所述多个预故障信息;上报所述多个预故障信息;在所述多个预故障信息中第一预故障信息先于至少一个第二预故障信息上报;所述至少一个第二预故障信息和第一预故障信息为同类预故障;带外管理模块,设置于所述服务器的操作系统外;所述带外管理模快用于获得所述第一预故障信息和所述至少一个第二预故障信息,确定所述第一预故障信息为绝对预故障告警;所述至少一个第二预故障信息为相对预故障告警;所述绝对预故障告警为所述多个预故障信息中首次产生的告警;所述相对预故障告警为所述多个预故障信息中在后产生的告警;所述服务器上报并呈现所述绝对预故障告警,抑制相对预故障告警;所述抑制为上报、记录但不呈现。2.根据权利要求1所述的告警管理系统,其特征在于,所述系统还包括:集中管理模块,用于获取并保存多个所述服务器上报的多个预故障告警,确定所述多个预故障告警中的绝对预故障告警和相对预故障告警;上报呈现所述绝对预故障告警,抑制所述相对预故障告警,所述多个服务器配置相同。3.根据权利要求2所述的告警管理系统,其特征在于,所述系统还包括:云管理模块,用于管理一个或多个所述集中管理模块,获取并保存多个所述集中管理模块上报的多个预故障告警,确定所述多个预故障告警中的绝对预故障告警和相对预故障告警;上报呈现所述绝对预故障告警,抑制所述...

【专利技术属性】
技术研发人员:王钦东刘国霞
申请(专利权)人:超聚变数字技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1