一种关键组件的故障告警方法、装置及大数据管理系统制造方法及图纸

技术编号:14336673 阅读:129 留言:0更新日期:2017-01-04 10:07
本发明专利技术公开了一种关键组件的故障告警方法、装置及大数据管理系统,其方法包括:当大数据管理系统关键组件的主节点故障时,根据主节点和备节点切换后的状态信息生成第一告警信息;根据告警信息与故障解决方案的对应关系,获取与第一告警信息对应的第一故障解决方案;将第一告警信息和第一故障解决方案输出。本发明专利技术通过当与关键组件高可用性相关的主备节点发生切换后生成对应的告警信息,获取与该告警信息相对应的解决方案,并与告警信息一同输出。采用该方法可及时处理故障的问题,并能够及时发现并处理集群问题,保证大数据管理系统的高可用性和可靠性。

【技术实现步骤摘要】

本专利技术涉及大数据管理系统领域,尤其涉及一种关键组件的故障告警方法、装置及大数据管理系统
技术介绍
随着网络和信息技术的不断普及,人类产生的数据量正在呈指数级增长。大约每两年翻一番,根据监测,这个速度在2020年之前会继续保持下去,这意味着人类在最近两年产生的数据量相当于之前产生的全部数据量。资料显示,2011年,全球数据规模为1.8ZB,可以填满575亿个32GB的iPad,这些iPad可以在中国修建两座长城。到2020年,全球数据将达到40ZB,如果把它们全部存入蓝光光盘,这些光盘和424艘尼米兹号航母重量相当。淘宝网站每天有超过数千万笔交易,单日数据产生量超过50TB(1TB等于1000GB),存储量40PB(1PB等于1000TB)。百度公司目前数据总量接近1000PB,存储网页数量接近1万亿页,每天大约要处理60亿次搜索请求,几十PB数据。大量新数据源的出现则导致了非结构化、半结构化数据爆发式的增长,信息数据的单位由TB-PB-EB-ZB的级别。如何管理和使用这些数据,已成为一个新的领域,大数据的概念应运而生。大数据有4V特点:数据量(Volume)大、数据类别(Variety)多、数据处理速度(Velocity)快、数据真实性(Veracity)高。其中,1、数据量大,现在大型数据集,数据量一般在10TB规模左右,目前一般认为PB级以上数据看成是大数据。2、数据类别多,数据种类和格式日渐丰富,包括文档、视频、图片、音频、数据库数据等3、数据处理速度快,在数据量非常庞大的情况下,也能够做到数据的实时处理。要求数据处理和I/O速度很快。4、数据真实性。数据是完整的和可信任,并能自信地用它来做出关键的决定的能力的组织。大数据让我们以一种前所未有的方式,通过对海量数据进行分析,获得有巨大价值的产品和服务,或深刻的洞见,最终形成变革之力。很多行业都会有大数据需求,譬如电信行业,互联网行业等等容易产生大量数据的行业,很多传统行业,譬如医药,教育,采矿,电力等等任何行业,都会有大数据需求。不同行业的数据有不同的自身特点,都需要结合自身的行业知识才能把大数据转换为价值。分析大数据的框架、产品、工具和系统纷纷进入用户的视线,为保证关键组件的高可用性,目前已有的大数据管理系统上报的关键组件的告警方法较少,虽对告警进行了级别分类,但上报的一些告警并没有给出解决方案,即看到告警的人员不清楚如何处理。
技术实现思路
为了解决上述技术问题,本专利技术提供了一种关键组件的故障告警方法、装置及大数据管理系统,解决了关键组件告警无法及时处理的问题。依据本专利技术的一个方面,提供了一种关键组件的故障告警方法,应用于大数据管理系统,其方法包括:当大数据管理系统关键组件的主节点故障时,根据主节点和备节点切换后的状态信息生成第一告警信息;根据告警信息与故障解决方案的对应关系,获取与第一告警信息对应的第一故障解决方案;将第一告警信息和第一故障解决方案输出。其中,根据主节点和备节点切换后的状态信息生成第一告警信息的步骤包括:主节点和备节点切换后的状态信息中仅有一个为激活状态时,生成第一级告警信息;主节点和备节点切换后的状态信息均为激活状态或者均不是激活状态时,生成第二级告警信息;其中,第二级告警信息的级别高于第一级告警信息的级别。其中,根据告警信息与故障解决方案的对应关系,获取与第一告警信息对应的第一故障解决方案的步骤包括:当第一告警信息为第一级告警信息时,获取自动恢复故障的故障解决方案;当第一告警信息为第二级告警信息时,获取需手动恢复故障的故障解决方案。其中,主节点和备节点切换后的状态信息中仅有一个为激活状态时,生成第一级告警信息的步骤包括:主节点由激活状态切换为备用状态,且备节点由备用状态切换为激活状态时,生成第一级第一子告警信息;主节点宕机或停运,且备节点由备用状态切换为激活状态时,生成第一级第二子告警信息。其中,主节点和备节点切换后的状态信息均为激活状态或者均不是激活状态时,生成第二级告警信息的步骤包括:主节点仍为激活状态,且备节点由备用状态切换为激活状态时,生成第二级第一子告警信息;主节点由激活状态切换为备用状态,且备节点仍为备用状态时,生成第二级第二子告警信息;主节点宕机或停运,且备节点仍为备用状态时,生成第二级第三子告警信息。其中,根据告警信息与故障解决方案的对应关系,获取与第一告警信息对应的第一故障解决方案的步骤之后,还包括:根据第一告警信息和第一故障解决方案生成一告警日志,并将告警日志保存至本地。其中,将第一告警信息和第一故障解决方案输出的步骤包括:将第一告警信息和第一故障解决方案发送至与关键组件所在的服务器预先绑定的移动终端;和/或将第一告警信息和第一故障解决方案输出至大数据管理系统的显示装置进行显示。依据本专利技术的再一个方面,还提供了一种关键组件的故障告警装置,应用于大数据管理系统,包括:生成模块,用于当大数据管理系统关键组件的主节点故障时,根据主节点和备节点切换后的状态信息生成第一告警信息;获取模块,用于根据告警信息与故障解决方案的对应关系,获取与第一告警信息对应的第一故障解决方案;输出模块,用于将第一告警信息和第一故障解决方案输出。其中,生成模块包括:第一生成单元,用于当主节点和备节点切换后的状态信息中仅有一个为激活状态时,生成第一级告警信息;第二生成单元,用于当主节点和备节点切换后的状态信息均为激活状态或者均不是激活状态时,生成第二级告警信息;其中,第二级告警信息的级别高于第一级告警信息的级别。其中,获取模块包括:第一获取单元,用于当第一告警信息为第一级告警信息时,获取自动恢复故障的故障解决方案;第二获取单元,用于当第一告警信息为第二级告警信息时,获取需手动恢复故障的故障解决方案。其中,第一生成单元包括:第一生成子单元,用于当主节点由激活状态切换为备用状态,且备节点由备用状态切换为激活状态时,生成第一级第一子告警信息;第二生成子单元,用于当主节点宕机或停运,且备节点由备用状态切换为激活状态时,生成第一级第二子告警信息。其中,第二生成单元包括:第三生成子单元,用于当主节点仍为激活状态,且备节点由备用状态切换为激活状态时,生成第二级第一子告警信息;第四生成子单元,用于当主节点由激活状态切换为备用状态,且备节点仍为备用状态时,生成第二级第二子告警信息;第五生成子单元,用于当主节点宕机或停运,且备节点仍为备用状态时,生成第二级第三子告警信息。其中,关键组件的故障告警装置还包括:存储模块,用于根据第一告警信息和第一故障解决方案生成一告警日志,并将告警日志保存至本地。其中,输出模块包括:第一输出单元,用于将第一告警信息和第一故障解决方案发送至与关键组件所在的服务器预先绑定的移动终端;和/或第二输出单元,用于将第一告警信息和第一故障解决方案输出至大数据管理系统的显示装置进行显示。依据本专利技术的再一个方面,还提供了一种大数据管理系统,包括如上所述的关键组件的故障告警装置。本专利技术的实施例的有益效果是:一种关键组件的故障告警方法、装置及大数据管理系统,通过当与关键组件高可用性相关的主备节点发生切换后生成对应的告警信息,获取与该告警信息相对应的解决方案,并与告警信息一同输出。采用该方法可及时本文档来自技高网
...
一种关键组件的故障告警方法、装置及大数据管理系统

【技术保护点】
一种关键组件的故障告警方法,应用于大数据管理系统,其特征在于,包括:当大数据管理系统关键组件的主节点故障时,根据主节点和备节点切换后的状态信息生成第一告警信息;根据告警信息与故障解决方案的对应关系,获取与所述第一告警信息对应的第一故障解决方案;将所述第一告警信息和所述第一故障解决方案输出。

【技术特征摘要】
1.一种关键组件的故障告警方法,应用于大数据管理系统,其特征在于,包括:当大数据管理系统关键组件的主节点故障时,根据主节点和备节点切换后的状态信息生成第一告警信息;根据告警信息与故障解决方案的对应关系,获取与所述第一告警信息对应的第一故障解决方案;将所述第一告警信息和所述第一故障解决方案输出。2.根据权利要求1所述的关键组件的故障告警方法,其特征在于,根据主节点和备节点切换后的状态信息生成第一告警信息的步骤包括:所述主节点和所述备节点切换后的状态信息中仅有一个为激活状态时,生成第一级告警信息;所述主节点和所述备节点切换后的状态信息均为激活状态或者均不是激活状态时,生成第二级告警信息;其中,所述第二级告警信息的级别高于所述第一级告警信息的级别。3.根据权利要求2所述的关键组件的故障告警方法,其特征在于,根据告警信息与故障解决方案的对应关系,获取与所述第一告警信息对应的第一故障解决方案的步骤包括:当所述第一告警信息为第一级告警信息时,获取自动恢复故障的故障解决方案;当所述第一告警信息为第二级告警信息时,获取需手动恢复故障的故障解决方案。4.根据权利要求2所述的关键组件的故障告警方法,其特征在于,所述主节点和所述备节点切换后的状态信息中仅有一个为激活状态时,生成第一级告警信息的步骤包括:所述主节点由激活状态切换为备用状态,且所述备节点由备用状态切换为激活状态时,生成第一级第一子告警信息;所述主节点宕机或停运,且所述备节点由备用状态切换为激活状态时,生
\t成第一级第二子告警信息。5.根据权利要求2所述的关键组件的故障告警方法,其特征在于,所述主节点和所述备节点切换后的状态信息均为激活状态或者均不是激活状态时,生成第二级告警信息的步骤包括:所述主节点仍为激活状态,且所述备节点由备用状态切换为激活状态时,生成第二级第一子告警信息;所述主节点由激活状态切换为备用状态,且所述备节点仍为备用状态时,生成第二级第二子告警信息;所述主节点宕机或停运,且所述备节点仍为备用状态时,生成第二级第三子告警信息。6.根据权利要求1或2所述的关键组件的故障告警方法,其特征在于,根据告警信息与故障解决方案的对应关系,获取与所述第一告警信息对应的第一故障解决方案的步骤之后,还包括:根据所述第一告警信息和所述第一故障解决方案生成一告警日志,并将所述告警日志保存至本地。7.根据权利要求1或2所述的关键组件的故障告警方法,其特征在于,将所述第一告警信息和所述第一故障解决方案输出的步骤包括:将所述第一告警信息和所述第一故障解决方案发送至与所述关键组件所在的服务器预先绑定的移动终端;和/或将所述第一告警信息和所述第一故障解决方案输出至所述大数据管理系统的显示装置进行显...

【专利技术属性】
技术研发人员:任聪
申请(专利权)人:中兴通讯股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1