The disclosed embodiment relates to a method and a device for fault management device, the method includes: check the equipment fault; in response to the equipment fault, fault fault report generation; to query the device object repository using the fault report, the object repository storage device associated with the history of fault information and the corresponding repair scheme; and from the device object repository obtain corresponding repair schemes. The embodiments of the present disclosure enable failure management of the equipment more rapidly and automatically.
【技术实现步骤摘要】
用于管理设备的故障的方法和装置
本公开的实施例总体上涉及设备管理领域,更具体地涉及用于管理设备的故障的方法和装置。
技术介绍
数据中心是包括各种设备的大型场所,随着信息技术的发展,数据中心的规模正在呈现指数级的增长,数据中心中安装的设备(例如,服务器、路由器、交换机、存储设备以及主机总线适配器等)也越来越多。由于设备数量的不断增多,数据中心中的设备管理变得更加复杂,并且资源消耗也日益增加。传统地,当数据中心中的某个设备发生故障时,通常单独地分析该故障,并且依据人工经验对故障进行修复。然而,设备故障通常非常复杂并且各不相同,因此,故障修复需要大量的人工操作,并且需要非常专业的技术知识。同时,一些故障会重复发生,因而需要重复地进行单独分析,此外,对于管理数据中心中的所有设备,缺乏一种直观的管理方式。因此,如何能够更快更好地对数据中心中的设备进行故障管理,成为一个亟需解决的问题。
技术实现思路
针对上述问题,本公开的各实施例提出了一种用于管理设备的故障的方法和装置,能够更快速、更自动地对数据中心中的设备进行故障管理。根据本公开的一个方面,公开了一种用于管理设备的故障的方法, ...
【技术保护点】
一种用于管理设备的故障的方法,包括:检查设备是否发生故障;响应于所述设备发生所述故障,生成所述故障的故障报告;利用所述故障报告来查询设备对象储存库,其中所述对象设备储存库存储与所述设备相关的历史故障信息以及对应的修复方案;以及从所述设备对象储存库获得所述对应的修复方案。
【技术特征摘要】
1.一种用于管理设备的故障的方法,包括:检查设备是否发生故障;响应于所述设备发生所述故障,生成所述故障的故障报告;利用所述故障报告来查询设备对象储存库,其中所述对象设备储存库存储与所述设备相关的历史故障信息以及对应的修复方案;以及从所述设备对象储存库获得所述对应的修复方案。2.根据权利要求1所述的方法,其中检查设备是否发生故障包括:在任务管理模块中生成新的任务之后,检查所述设备是否发生故障。3.根据权利要求1所述的方法,其中检查设备是否发生故障包括:周期性地检查所述设备是否发生故障;以及当所述设备发生所述故障时,在任务管理模块中生成新的任务。4.根据权利要求2或3所述的方法,其中检查设备是否发生故障还包括:获得所述设备的运行状态信息;以及基于所述运行状态信息,确定所述设备是否发生故障。5.根据权利要求1所述的方法,其中响应于所述设备发生所述故障,生成所述故障的故障报告包括:针对所述故障,对所述设备与其他设备执行关联分析,以确定产生所述故障的根源。6.根据权利要求5所述的方法,其中所述故障报告包括以下各项中的至少一项:所述故障的故障码、所述故障的日志、所述设备的标识符、所述设备的类型、所述设备的销售商以及所述设备的位置。7.根据权利要求1所述的方法,其中从所述设备对象储存库获得所述对应的修复方案包括:确定所述故障信息与所述历史故障信息中的每条历史故障信息之间的匹配度;确定所述历史故障信息中具有最大匹配度的特定历史故障信息,以及从所述设备对象储存库获得与所述特定历史故障信息相对应的修复方案。8.根据权利要求7所述的方法,其中所述匹配度包括多个子匹配度,所述多个子匹配度包括以下各项中的至少两项:类型匹配度、销售商匹配度、故障码匹配度以及故障日志匹配度。9.根据权利要求2或3所述的方法,还包括:在从所述设备对象储存库获得所述修复方案之后,根据所述修复方案来修复所述故障;重新检查所述设备是否存在故障,以及响应于所述设备不存在故障,自动关闭所述任务。10.根据权利要求2或3所述的方法,还包括:从所述任务管理模块获得所有设备的运行状态信息以用于显示。11.根据权利要求2或3所述的方法,还包括:对所述设备对象储存库中的所有历史故障信息进行分析,以便对所述设备对象储存库中的所有设备的故障进行预测。12.一种用于管理设备的故障的装置,包括:检查装置,用于检查设备是否发生故障;分析装置,用于响应于所述设备发生所述故障,生成所述故障的故障报告;查询装置,用于利用所述故障报告来查询设备对象储存库,其中所述对象设备储存库存储与所述设备相关的...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。