一种服务器集群故障自动处理系统技术方案

技术编号:12520507 阅读:79 留言:0更新日期:2015-12-17 11:20
本发明专利技术公开一种服务器集群故障自动处理系统,属于服务器集群管理技术领域;本发明专利技术采用服务器集中管理模块、故障分析模块、故障智慧库模块、故障处理模块,服务器集中管理模块监控到服务器故障后,由故障分析模块整理分析故障告警,并在故障智慧库模块中查询相关处理策略,将故障信息和故障处理策略发送到故障处理模块,完成故障自动处理,使该系统根据自带故障处理策略和用户自定义故障处理策略,实现自动处理服务器故障,很大程度上减轻了机房维护人员的负担,避免资源浪费。

【技术实现步骤摘要】

本专利技术公开一种服务器集群故障自动处理系统,属于服务器集群管理

技术介绍
随着云计算的发展和应用,服务器设备的需求也从最初的单台或者少量的需求方式发展到至今的大规模大批量的需求方式。服务器集群就是指将很多服务器集中起来一起进行同一种服务,在客户端看来就像是只有一个服务器。集群可以利用多个计算机进行并行计算从而获得很高的计算速度,但是集群中的应用只在一台服务器上运行,如果这个应用出现故障,其它的某台服务器如果重新启动这个应用,接管位于共享磁盘柜上的数据区,进而使应用重新正常运转需要侦测并确认故障、后备服务器重新启动该应用、接管共享的数据区,其切换的过程需要花费时间,而且越大的应用切换的时间越长。面对大规模的服务器集群,各种处理难易程度不等的大量故障,给维护人员带来庞大的工作量,也导致资源的浪费。本专利技术提供一种服务器集群故障自动处理系统,采用服务器集中管理模块、故障分析模块、故障智慧库模块、故障处理模块,服务器集中管理模块监控到服务器故障后,由故障分析模块整理分析故障告警,并在故障智慧库模块中查询相关处理策略,将故障信息和故障处理策略发送到故障处理模块,完成故障自动处理,使该系统根据自带故障处理策略和用户自定义故障处理策略,实现自动处理服务器故障,很大程度上减轻了机房维护人员的负担,避免资源浪费。
技术实现思路
本专利技术针对大规模的服务器集群,各种处理难易程度不等的大量故障,给维护人员带来庞大的工作量,也导致资源的浪费的问题,提供一种服务器集群故障自动处理系统,通过系统自带的故障处理策略以及用户自定义的故障处理策略,可以灵活自动处理各种类型,多种难度的服务器故障。极大的减轻了维护人员的工作量,避免人力物力资源的浪费,具有很高的应用价值。本专利技术提出的具体方案是: 一种服务器集群故障自动处理系统,包括服务器集中管理模块、故障分析模块、故障智慧库模块、故障处理模块; 服务器集中管理模块负责对服务器集群进行故障监控和故障,调用故障分析模块进行故障分析; 故障分析模块负责进行整理分析,并调用故障智慧库模块中的故障智慧库查询相关解决策略,并将故障处理分析结论、处理策略通知故障处理模块进行故障处理; 故障智慧库模块负责存储服务器故障处理策略,为服务器故障正确的自动处理提供可靠保障;故障处理模块负责根据故障分析模块提供的故障信息和处理策略,自动完成服务器故障的处理和修复。其中服务器集中管理模块同时可获取和存储故障告警信息。所述故障智慧库模块中智慧库的故障处理策略来源分为系统自带的处理策略和用户自定义的处理策略;系统自带的处理策略为系统原有存储的处理策略,用户自定义的处理策略为用户根据以往处理的故障类型,制定的并存储在系统中的处理策略。所述故障智慧库模块设置故障处理模板,实例化故障处理模板为处理策略,对监控中发生的故障进行数据化处理,根据处理策略对数据化的故障进行处理。所述故障处理模板分为系统处理模板和用户自定义处理模板,系统处理模板为系统原有存储的故障处理模板,用户自定义处理模板为用户根据以往处理的故障类型,制定的并存储在系统中的故障处理模板。—种服务器集群故障自动处理方法,利用所述的系统,使用服务器集中管理模块对服务器集群进行故障监控和故障,调用故障分析模块进行故障分析; 故障分析模块进行整理分析,并调用故障智慧库模块中的故障智慧库查询相关解决策略,并将故障处理分析结论、处理策略通知故障处理模块进行故障处理; 故障智慧库模块存储服务器故障处理策略,为服务器故障正确的自动处理提供可靠保障; 故障处理模块根据故障分析模块提供的故障信息和处理策略,自动完成服务器故障的处理和修复。所述故障智慧库模块中智慧库的故障处理策略来源分为系统自带的处理策略和用户自定义的处理策略;系统自带的处理策略为系统原有存储的处理策略,用户自定义的处理策略为用户根据以往处理的故障类型,制定的并存储在系统中的处理策略。所述故障智慧库模块设置故障处理模板,实例化故障处理模板为处理策略,对监控中发生的故障进行数据化处理,根据处理策略对数据化的故障进行处理。所述故障处理模板分为系统处理模板和用户自定义处理模板,系统处理模板为系统原有存储的故障处理模板,用户自定义处理模板为用户根据以往处理的故障类型,制定的并存储在系统中的故障处理模板。本专利技术的有益之处是:本专利技术包括服务器集中管理模块、故障分析模块、故障智慧库模块、故障处理模块;服务器集中管理模块负责对服务器集群进行故障监控和故障,调用故障分析模块进行故障分析;故障分析模块负责进行整理分析,并调用故障智慧库模块中的故障智慧库查询相关解决策略,并将故障处理分析结论、处理策略通知故障处理模块进行故障处理;故障智慧库模块负责存储服务器故障处理策略,为服务器故障正确的自动处理提供可靠保障;故障处理模块负责根据故障分析模块提供的故障信息和处理策略,自动完成服务器故障的处理和修复。使该系统根据自带故障处理策略和用户自定义故障处理策略,实现自动处理服务器故障,而且灵活自动处理各种类型,多种难度的服务器故障,很大程度上减轻了机房维护人员的负担,避免资源浪费,具有很高的应用价值。【附图说明】图1本专利技术服务器故障处理系统示意图。【具体实施方式】—种服务器集群故障自动处理系统,包括服务器集中管理模块、故障分析模块、故障智慧库模块、故障处理模块; 服务器集中管理模块负责对服务器集群进行故障监控和故障,调用故障分析模块进行故障分析; 故障分析模块负责进行整理分析,并调用故障智慧库模块中的故障智慧库查询相关解决策略,并将故障处理分析结论、处理策略通知故障处理模块进行故障处理; 故障智慧库模块负责存储服务器故障处理策略,为服务器故障正确的自动处理提供可靠保障; 故障处理模块负责根据故障分析模块提供的故障信息和处理策略,自动完成服务器故障的处理和修复。根据上述系统,结合附图对本专利技术做进一步说明。其中上述系统中服务器集中管当前第1页1 2 本文档来自技高网...

【技术保护点】
一种服务器集群故障自动处理系统,其特征是包括服务器集中管理模块、故障分析模块、故障智慧库模块、故障处理模块;服务器集中管理模块负责对服务器集群进行故障监控和故障,调用故障分析模块进行故障分析;故障分析模块负责进行整理分析,并调用故障智慧库模块中的故障智慧库查询相关解决策略,并将故障处理分析结论、处理策略通知故障处理模块进行故障处理;故障智慧库模块负责存储服务器故障处理策略,为服务器故障正确的自动处理提供可靠保障;故障处理模块负责根据故障分析模块提供的故障信息和处理策略,自动完成服务器故障的处理和修复。

【技术特征摘要】

【专利技术属性】
技术研发人员:李锋
申请(专利权)人:浪潮集团有限公司
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1