【技术实现步骤摘要】
【国外来华专利技术】管理系统及管理程序
本专利技术涉及例如对包括主计算机(hostcomputer)、网络装置及存储装置等管理对象装置的计算机系统进行管理的技术。
技术介绍
在计算机系统的管理中,通过使用事件关联(EventCorrelation)技术等确定事件基础中的故障原因的技术,计算机系统的管理者能够检测出在计算机系统中所发生的故障的原因(参照专利文献1)。例如,专利文献2公开了如下技术:用于分析在管理对象装置中所发生的多个故障等的事件的因果关系的分析引擎,将由事前确定的条件句和结论句构成的通用规则应用于与管理对象装置有关的事件,例如性能值超过规定的阈值的事件,由此,生成包含成为性能下降的原因的原因事件和由其引起的条件事件组的展开规则,并基于所生成的展开规则进行故障原因的确定。在近年来的计算机系统中,作为针对故障的恢复方案(从故障的复原、即用于进行故障恢复的方法),存在很多能够实施的有用的方法,例如存在当配置系统资源(虚拟机、数据)时,通过进行适当的数据移动而进行从故障的复原之类的方法等。作为进行数据移动的技术,已知有例如在物理的主计算机之上使多个虚拟的主计算机(即虚拟机,以下称为“VM”)动作的环境中,按照表示VM的性能的信息和资源的利用信息,使VM的动作从某物理的主计算机移交至其他物理的主计算机的技术(第一VM移动)、和使存储于某存储区域的VM向其他存储区域移动的技术(第二VM移动)。这里,VM是存储区域所存储的数据的一种,VM移动(第一VM移动和第二VM移动)是存储区域间的数据移动的一种。此外,作为在存储装置的数据存储区域(卷)间进行数据移动的技术,已知有卷迁移( ...
【技术保护点】
一种管理程序,其使构成对具有多个管理对象器件的计算机系统进行管理的管理系统的计算机执行如下处理:基于一个以上的规则,对在所述多个管理对象器件的任一个中发生的事件的原因进行分析,确定成为所发生的所述事件的原因的候选的第一原因事件,其中,该一个以上的规则表示与所述多个管理对象器件的任一个有关的原因事件、和满足所述原因事件成为原因这一条件的、与所述多个管理对象器件的任一个有关的一个以上的条件事件的对应关系,基于方案信息,确定在所述第一原因事件为原因的情况下能够实施的多个第一方案,其中,该方案信息表示所述规则和在所述规则的原因事件为原因的情况下能够实施的作为恢复方案的方案的对应关系,基于方案历史信息,对于多个所述第一方案中的各个方案,计算表示在实施了该方案的情况下故障恢复成功的可能性的指标值,其中,该方案历史信息按所述方案的每次实施,表示通过该方案的实施而带来的故障恢复的成功与否,按照基于所述指标值而决定的显示方式,显示表示所述多个第一方案中的任意一个以上的方案的数据。
【技术特征摘要】
【国外来华专利技术】1.一种管理方法,其使构成对具有多个管理对象器件的计算机系统进行管理的管理系统的计算机执行如下处理:基于一个以上的规则,对在所述多个管理对象器件的任一个中发生的事件的原因进行分析,确定成为所发生的所述事件的原因的候选的第一原因事件,其中,该一个以上的规则表示与所述多个管理对象器件的任一个有关的原因事件、和满足所述原因事件成为原因这一条件的、与所述多个管理对象器件的任一个有关的一个以上的条件事件的对应关系,基于方案信息,确定在所述第一原因事件为原因的情况下能够实施的多个第一方案,其中,该方案信息表示所述规则和在所述规则的原因事件为原因的情况下能够实施的作为恢复方案的方案的对应关系,基于方案历史信息,对于多个所述第一方案中的各个方案,计算表示在实施了该方案的情况下故障恢复成功的可能性的指标值,其中,该方案历史信息按所述方案的每次实施,表示通过该方案的实施而带来的故障恢复的成功与否,按照基于所述指标值而决定的显示方式,显示表示所述多个第一方案中的任意一个以上的方案的数据,从所述多个第一方案中提取所述指标值为规定值以上的一个以上的方案,显示表示提取出的该一个以上的方案的数据,对提取出的所述一个以上的方案,从所述指标值高的方案开始依次排列显示,在发生的所述事件的原因分析中,对一个以上的规则的各自的原因事件,计算表示该原因事件为原因的确定性的可靠度,基于所述可靠度确定所述第一原因事件,在关于所述第一原因事件的所述可靠度为规定值以上的情况下,实施所述多个第一方案中的所述指标值最高的第二方案。2.根据权利要求1所述的管理方法,其使所述计算机执行如下处理:在关于所述第一原因事件的所述可靠度为规定值以上,并且在关于所述第二方案的所述指标值为规定值以上的情况下,实施所述第二方案。3.根据权利要求2所述的管理方法,其使所述计算机执行如下处理:所述多个第一方案中的一个方案被实施后,将表示通过所述一个方案的实施而带来的故障恢复的成功与否的数据,追加到所述方案历史信息中。4.根据权利要求3所述的管理方法,其中,所述方案历史信息包含多个历史要素,该历史要素将包含过去确定为原因的候选的原因事件的规则、该规则的原因事件被确定为原因的候选时所实施的方案、和通过该方案的实施而带来的故障恢复的成功与否的信息建立对应地表示,所述管理方法使所述计算机执行如下处理:基于所述方案信息及所述方案历史信息,按一个以上的规则中的一个规则和与该规则对应的一个方案的每个组合,判断在所述方案历史信息中是否包含有规定数量以上的与该组合有关的历史要素,对于未包含规定数量以上的历史要素的组合,在将构成该组合的规则的原因事件作为原因的故障情况下,进行实施构成该组合的方案的测试,生成基于该测试的结果的与该组合有关的历史要素,并将生成的历史要素追加到所述方案历史信息中。5.根据权利要求4所述的管理方法,其中,所述方案历史信息包含多个历史要素,该历史要素将包含过去确定为原因的候选的原因事件的规则、该规则的原因事件被确定为原因的候选时所实施的方案、和通过该方案的实施而带来的故障恢复的成功与否的信息建立对应地表示,所述管理方法使所述计算机执行如下处理:在所述方案历史信息中包含规定数量以上的、与所述方案历史信息所包含的第一历史要素表示的规则和所述第一历史要素表示的方案的组合有关的历史要素的情况下,将包含与该组合有关的历史要素的数据向管理与所述计算机系统不同的计算机系统的管理系统发送,在从管理与所述计算机系统不同的计算机系统的管理系统接收到包含历史要素的数据的情况下,将接收到的所述数据所包含的历史要素追加到所述方案历史信息中。6.根据权利要求5所述的管理方法,其中,所述规则包含通用规则和展开规则,其中,该通用规则是将与所述原因事件及所述条件事件有关联的管理对象器件以该管理对象器件的类别表示的规则,该展开规则是将与所述原因事件及所述条件事件有关联的管理对象器件的类别以表示特定的管理对象器件的数据来表示的规则,所述方案包含通用方案和展开方案,其中,该通用方案是不依赖于所述计算机系统的实际结构的形式的恢复方案,该展开方案是考虑所述计算机系统的实际结构将所述通用方案展开而得到的恢复方案,所述方案信息表示所述通用规则和所述通用规则的原因事件为原因的情况下能够实施的通用方案的对应关系,所述方案历史信息按所述展开方案的每次实施,表示通过该展开方案的实施而带来的故障恢复的成功与否,并包含多个历史要素,其中,该历史要素将包含过去确定为原因的候选的原因事件的展开规则、该展开规则的原因事件被确定为原因的候选时所实施的展开方案、和通过该展开方案的实施而带来的故障恢复的成功与否的信息建立对应地表示,所述管理方法使所述计算机执行如下处理:基于表示...
【专利技术属性】
技术研发人员:名仓正刚,中岛淳,永井崇之,工藤裕,
申请(专利权)人:株式会社日立制作所,
类型:发明
国别省市:日本;JP
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。