【技术实现步骤摘要】
本专利技术公开,属于故障处理
技术介绍
随着数据中心的飞速发展,数据中心的规模越来越大,所涉及的运维和故障处理工作也越来越多、越来越复杂,更何况目前的发展趋势下数据中心的规模在不断扩大、数据中心中的资源类型也越来越多、越复杂。例如,一个包括了 200种资源类型、10000个资源的数据中心,用传统的故障处理方式已经无法满足,传统的故障处理方式只能散乱地、相对独立地处理监控报告出来的问题,并且是各类管理员各自处理其领域内的故障,各类管理员所面对的故障问题不能很好的关联协调,也无法一步到位地定位到故障发生的根本原因,并且在故障处理时只能凭借管理员自身的经验水平完成故障处理,往往造成数据库管理员浪费很多时间去定位问题,导致大规模数据中心故障处理的不够及时和效率不高。为此,本专利技术提供,采用故障知识库与故障处理策略库的相结合的方式,自动化故障处理模块完成故障原因分析、匹配故障处理策略并根据处理方式驱动完成故障处理,并在检测确认后将故障处理的经验积累到故障知识库中;故障处理策略管理模块分析故障知识库中的故障原因,生成处理策略,定义故障处理方式,使得故障处 ...
【技术保护点】
一种基于故障知识库的自动化故障处理系统,其特征是包括故障监测模块、故障处理策略管理模块、故障原因分析模块、故障知识库、自动化故障处理模块;故障监测模块负责监控系统,发现故障问题后,根据故障知识库将故障进行归类处理并交由自动化故障处理模块进行处理;故障处理策略管理模块基于故障知识库的积累,调用故障原因分析模块逐条分析故障原因,并根据具体的故障原因定义对应的处理策略,形成故障处理策略库;故障知识库为每类故障定义参数,以便查找故障信息,并不断完善故障信息;自动化故障处理模块利用故障处理策略库中的数据信息,在接收到故障监测模块监测到的故障后先进行故障定位,再调用故障原因分析模块进行 ...
【技术特征摘要】
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。