管理系统及管理程序技术方案

技术编号:11381191 阅读:58 留言:0更新日期:2015-05-01 03:24
管理系统对具有多个管理对象器件的计算机系统进行管理。管理系统的存储器件存储一个以上的规则、方案信息和方案历史信息。管理系统的控制器件基于一个以上的规则,确定成为在多个管理对象器件的任一个所发生的事件的原因的候选的第一原因事件;基于方案信息,确定在第一原因事件为原因的情况下能够实施的多个第一方案;基于方案历史信息,对多个第一方案中的各个方案,计算表示在实施了该方案的情况下故障恢复成功的可能性的指标值,并按照基于指标值而决定的显示方式,显示表示多个第一方案中的任意一个以上的方案的数据。

【技术实现步骤摘要】
【国外来华专利技术】管理系统及管理程序
本专利技术涉及例如对包括主计算机(hostcomputer)、网络装置及存储装置等管理对象装置的计算机系统进行管理的技术。
技术介绍
在计算机系统的管理中,通过使用事件关联(EventCorrelation)技术等确定事件基础中的故障原因的技术,计算机系统的管理者能够检测出在计算机系统中所发生的故障的原因(参照专利文献1)。例如,专利文献2公开了如下技术:用于分析在管理对象装置中所发生的多个故障等的事件的因果关系的分析引擎,将由事前确定的条件句和结论句构成的通用规则应用于与管理对象装置有关的事件,例如性能值超过规定的阈值的事件,由此,生成包含成为性能下降的原因的原因事件和由其引起的条件事件组的展开规则,并基于所生成的展开规则进行故障原因的确定。在近年来的计算机系统中,作为针对故障的恢复方案(从故障的复原、即用于进行故障恢复的方法),存在很多能够实施的有用的方法,例如存在当配置系统资源(虚拟机、数据)时,通过进行适当的数据移动而进行从故障的复原之类的方法等。作为进行数据移动的技术,已知有例如在物理的主计算机之上使多个虚拟的主计算机(即虚拟机,以下称为“VM”)动作的环境中,按照表示VM的性能的信息和资源的利用信息,使VM的动作从某物理的主计算机移交至其他物理的主计算机的技术(第一VM移动)、和使存储于某存储区域的VM向其他存储区域移动的技术(第二VM移动)。这里,VM是存储区域所存储的数据的一种,VM移动(第一VM移动和第二VM移动)是存储区域间的数据移动的一种。此外,作为在存储装置的数据存储区域(卷)间进行数据移动的技术,已知有卷迁移(参照专利文献3)。非专利文献1公开了如下技术:在实施针对故障的恢复方案后,检查通过该恢复方案故障是否得到改善,未改善的情况下自动实施事前定义的其他恢复方案。此外,专利文献4公开了如下技术:预先记录针对故障过去实施了哪种恢复方案,并在选择恢复方案时利用记录的该信息。现有技术文献专利文献专利文献1:美国专利第7107185号说明书专利文献2:日本特开2010-86115号公报专利文献3:美国专利第6108748号说明书专利文献4:国际公开第2011/007394号小册子非专利文献非专利文献1:工藤裕、森村知弘、增冈义政、荐田宪久著“面向信息系统的操作自动化的策略记述形式和策略执行计划方式”、电气学会C部门论文期刊、Vol.131,No.10,2011.
技术实现思路
在应对通过专利文献1或专利文献2之类的事件关联(EventCorrelation)技术所确定出的故障的情况下,不论管理者具体实施哪种恢复方案来进行故障恢复,都存在从故障至复原需花费成本的技术问题。在获取故障原因和针对故障原因的恢复方案的映射后,即使能够基于该映射生成针对故障原因的恢复方案,在实际的操作管理现场,为了按照进行从故障的复原操作的管理者的意图实施操作而优先选择哪种恢复方案为好,对管理者来说也是不清楚的。换句话说,在将故障原因和针对故障原因的恢复方案提示给管理者时,根据管理者的意图(基于故障恢复所需的人力或经济的成本、或基于成为复原操作的对象的装置的重要性进行的优先度判断等),即使只能选择在某种程度上限定出的恢复方案,但由于能够推导出的多个恢复方案被提示给管理者,因此选择哪个恢复方案为好对管理者来说也存在选择困难。如果利用非专利文献1公开的技术,则通过实施被选择的恢复方案来检查故障是否得到改善,未改善的情况下能够自动实施事前定义的其他的恢复方案。由此,恢复方案实施后还残留问题部位的情况下,还能够实施其他的恢复方案。但是,在发生有与过去相同的故障的情况下,由于管理者未考虑过去实施了哪种恢复方案,因此,存在优先地提示或实施非管理者意图的恢复方案的情况,从而有可能招致管理者选择恢复方案时的成本的增加。第一种观点涉及的管理系统,对具有多个管理对象器件的计算机系统进行管理。管理系统的存储器件存储一个以上的规则、方案信息和方案历史信息,其中,该一个以上的规则表示与多个管理对象器件的任一个有关的原因事件、和与满足原因事件成为原因这一条件的、与多个管理对象器件的任一个有关的一个以上的条件事件的对应关系;该方案信息表示规则和该规则的原因事件为原因的情况下能够实施的作为恢复方案的方案的对应关系;该方案历史信息按方案的每次实施表示通过该方案的实施而带来的故障恢复的成功与否。管理系统的控制器件基于一个以上的规则,对在多个管理对象器件的任一个所发生的事件的原因进行分析,确定成为所发生的事件的原因的候选的第一原因事件;基于方案信息,确定第一原因事件为原因的情况下能够实施的多个第一方案;基于方案历史信息,对多个第一方案的各个方案,计算表示在实施了该方案的情况下故障恢复成功的可能性的指标值,并按照基于指标值而决定的显示方式,显示表示多个第一方案中的任意一个以上的方案的数据。另外,“显示数据”可以是在管理系统所具有的显示器件上显示数据,也可以是将用于显示的数据发送到具有连接于管理系统的显示器件的远程计算机。根据本专利技术,能够提供用于应对故障的支援管理者的技术。附图说明图1是第一实施方式涉及的计算机系统的一个例子的结构图。图2是第一实施方式涉及的主计算机的一个例子的结构图。图3是第一实施方式涉及的存储装置的一个例子的结构图。图4是第一实施方式涉及的管理服务器的一个例子的结构图。图5是第一实施方式涉及的装置性能管理表的一个例子的结构图。图6是第一实施方式涉及的卷拓扑管理表的一个例子的结构图。图7是第一实施方式涉及的事件管理表的一个例子的结构图。图8是第一实施方式涉及的通用规则的一个例子的结构图。图9A是表示第一实施方式涉及的展开规则的第一个例子的图。图9B是表示第一实施方式涉及的展开规则的第二个例子的图。图9C是表示第一实施方式涉及的展开规则的第三个例子的图。图9D是表示第一实施方式涉及的展开规则的第四个例子的图。图10是第一实施方式涉及的分析结果管理表的一个例子的结构图。图11是第一实施方式涉及的通用方案表的一个例子的结构图。图12是第一实施方式涉及的展开方案表的一个例子的结构图。图13是第一实施方式涉及的规则及方案对应管理表的一个例子的结构图。图14是第一实施方式涉及的方案执行历史管理表的一个例子的结构图。图15是第一实施方式涉及的性能信息获取处理的流程图。图16是第一实施方式涉及的故障原因分析处理的流程图。图17是第一实施方式涉及的方案展开处理的流程图。图18是第一实施方式涉及的方案执行后危险提取处理的流程图。图19是第一实施方式涉及的方案提示处理的流程图。图20是第一实施方式涉及的方案提示画面的一个例子的结构图。图21是第一实施方式涉及的方案执行处理的流程图。图22是第二实施方式涉及的管理服务器的一个例子的结构图。图23是第二实施方式涉及的测试案例库的一个例子的结构图。图24是第二实施方式涉及的测试案例提取处理的流程图。图25是第三实施方式涉及的计算机系统的一个例子的结构图。图26是第三实施方式涉及的管理服务器的一个例子的结构图。图27是第三实施方式涉及的方案执行历史管理表的一个例子的结构图。图28是第三实施方式涉及的管理服务器一览表的一个例子的结构图。图29是第三实施方式涉及的方案执行历史交换处理的流程图。本文档来自技高网
...
管理系统及管理程序

【技术保护点】
一种管理程序,其使构成对具有多个管理对象器件的计算机系统进行管理的管理系统的计算机执行如下处理:基于一个以上的规则,对在所述多个管理对象器件的任一个中发生的事件的原因进行分析,确定成为所发生的所述事件的原因的候选的第一原因事件,其中,该一个以上的规则表示与所述多个管理对象器件的任一个有关的原因事件、和满足所述原因事件成为原因这一条件的、与所述多个管理对象器件的任一个有关的一个以上的条件事件的对应关系,基于方案信息,确定在所述第一原因事件为原因的情况下能够实施的多个第一方案,其中,该方案信息表示所述规则和在所述规则的原因事件为原因的情况下能够实施的作为恢复方案的方案的对应关系,基于方案历史信息,对于多个所述第一方案中的各个方案,计算表示在实施了该方案的情况下故障恢复成功的可能性的指标值,其中,该方案历史信息按所述方案的每次实施,表示通过该方案的实施而带来的故障恢复的成功与否,按照基于所述指标值而决定的显示方式,显示表示所述多个第一方案中的任意一个以上的方案的数据。

【技术特征摘要】
【国外来华专利技术】1.一种管理方法,其使构成对具有多个管理对象器件的计算机系统进行管理的管理系统的计算机执行如下处理:基于一个以上的规则,对在所述多个管理对象器件的任一个中发生的事件的原因进行分析,确定成为所发生的所述事件的原因的候选的第一原因事件,其中,该一个以上的规则表示与所述多个管理对象器件的任一个有关的原因事件、和满足所述原因事件成为原因这一条件的、与所述多个管理对象器件的任一个有关的一个以上的条件事件的对应关系,基于方案信息,确定在所述第一原因事件为原因的情况下能够实施的多个第一方案,其中,该方案信息表示所述规则和在所述规则的原因事件为原因的情况下能够实施的作为恢复方案的方案的对应关系,基于方案历史信息,对于多个所述第一方案中的各个方案,计算表示在实施了该方案的情况下故障恢复成功的可能性的指标值,其中,该方案历史信息按所述方案的每次实施,表示通过该方案的实施而带来的故障恢复的成功与否,按照基于所述指标值而决定的显示方式,显示表示所述多个第一方案中的任意一个以上的方案的数据,从所述多个第一方案中提取所述指标值为规定值以上的一个以上的方案,显示表示提取出的该一个以上的方案的数据,对提取出的所述一个以上的方案,从所述指标值高的方案开始依次排列显示,在发生的所述事件的原因分析中,对一个以上的规则的各自的原因事件,计算表示该原因事件为原因的确定性的可靠度,基于所述可靠度确定所述第一原因事件,在关于所述第一原因事件的所述可靠度为规定值以上的情况下,实施所述多个第一方案中的所述指标值最高的第二方案。2.根据权利要求1所述的管理方法,其使所述计算机执行如下处理:在关于所述第一原因事件的所述可靠度为规定值以上,并且在关于所述第二方案的所述指标值为规定值以上的情况下,实施所述第二方案。3.根据权利要求2所述的管理方法,其使所述计算机执行如下处理:所述多个第一方案中的一个方案被实施后,将表示通过所述一个方案的实施而带来的故障恢复的成功与否的数据,追加到所述方案历史信息中。4.根据权利要求3所述的管理方法,其中,所述方案历史信息包含多个历史要素,该历史要素将包含过去确定为原因的候选的原因事件的规则、该规则的原因事件被确定为原因的候选时所实施的方案、和通过该方案的实施而带来的故障恢复的成功与否的信息建立对应地表示,所述管理方法使所述计算机执行如下处理:基于所述方案信息及所述方案历史信息,按一个以上的规则中的一个规则和与该规则对应的一个方案的每个组合,判断在所述方案历史信息中是否包含有规定数量以上的与该组合有关的历史要素,对于未包含规定数量以上的历史要素的组合,在将构成该组合的规则的原因事件作为原因的故障情况下,进行实施构成该组合的方案的测试,生成基于该测试的结果的与该组合有关的历史要素,并将生成的历史要素追加到所述方案历史信息中。5.根据权利要求4所述的管理方法,其中,所述方案历史信息包含多个历史要素,该历史要素将包含过去确定为原因的候选的原因事件的规则、该规则的原因事件被确定为原因的候选时所实施的方案、和通过该方案的实施而带来的故障恢复的成功与否的信息建立对应地表示,所述管理方法使所述计算机执行如下处理:在所述方案历史信息中包含规定数量以上的、与所述方案历史信息所包含的第一历史要素表示的规则和所述第一历史要素表示的方案的组合有关的历史要素的情况下,将包含与该组合有关的历史要素的数据向管理与所述计算机系统不同的计算机系统的管理系统发送,在从管理与所述计算机系统不同的计算机系统的管理系统接收到包含历史要素的数据的情况下,将接收到的所述数据所包含的历史要素追加到所述方案历史信息中。6.根据权利要求5所述的管理方法,其中,所述规则包含通用规则和展开规则,其中,该通用规则是将与所述原因事件及所述条件事件有关联的管理对象器件以该管理对象器件的类别表示的规则,该展开规则是将与所述原因事件及所述条件事件有关联的管理对象器件的类别以表示特定的管理对象器件的数据来表示的规则,所述方案包含通用方案和展开方案,其中,该通用方案是不依赖于所述计算机系统的实际结构的形式的恢复方案,该展开方案是考虑所述计算机系统的实际结构将所述通用方案展开而得到的恢复方案,所述方案信息表示所述通用规则和所述通用规则的原因事件为原因的情况下能够实施的通用方案的对应关系,所述方案历史信息按所述展开方案的每次实施,表示通过该展开方案的实施而带来的故障恢复的成功与否,并包含多个历史要素,其中,该历史要素将包含过去确定为原因的候选的原因事件的展开规则、该展开规则的原因事件被确定为原因的候选时所实施的展开方案、和通过该展开方案的实施而带来的故障恢复的成功与否的信息建立对应地表示,所述管理方法使所述计算机执行如下处理:基于表示...

【专利技术属性】
技术研发人员:名仓正刚中岛淳永井崇之工藤裕
申请(专利权)人:株式会社日立制作所
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1