对具有多个监视对象器件的计算机系统进行管理的管理系统技术方案

技术编号:10866434 阅读:98 留言:0更新日期:2015-01-07 07:45
管理系统对具有多个监视对象器件的计算机系统进行管理。管理系统的存储器件存储通用规则、通用方案信息、未解决信息和结构信息。监视系统的控制器件基于通用规则和结构信息,生成多个展开规则,在与多个监视对象器件的任一个有关的事件产生的情况下,基于多个展开规则,确定成为产生的事件的原因的候选的第1结论事件,基于通用方案信息,生成在第1结论事件为原因的情况下能够采取的恢复方案的一个以上的展开方案,基于未解决信息确定未解决事件,基于确定的未解决事件确定危险部位,显示第1结论事件、展开方案和表示危险部位的数据。

【技术实现步骤摘要】
【国外来华专利技术】对具有多个监视对象器件的计算机系统进行管理的管理系统
本专利技术涉及例如对包括主计算机(host computer)、网络交换机和存储装置等监视对象装置的计算机系统进行管理的技术。
技术介绍
在计算机系统的管理中,通过使用确定Event Correlat1n(事件关联)技术等事件基础中的故障原因的技术,计算机系统的管理者能够能够检测在计算机系统中产生的故障的原因(参照专利文献I)。 另外,存在如下技术:用于对在处于管理下的设备中产生的多个故障事件的因果关系进行分析的分析机,将由事前确定的条件句和结论句构成的通用规则应用于与处于管理下的设备有关的事件、例如性能值超过规定的阈值的事件,由此生成包含成为性能下降的原因的结论事件和由其引起的条件事件组的展开规则,基于生成的展开规则进行故障的确定(参照专利文献2)。 在近年的计算机系统中,作为针对通过原因分析确定的原因的复原方法存在很多能够实施的有用的方法,例如存在当配置系统资源(虚拟机、数据)时,通过进行适当的数据移动从故障进行复原之类的方法等。作为数据移动技术已知有,例如在物理主计算机之上使多个虚拟的主计算机(即,为虚拟机,以下称为“VM”)动作的环境中,根据显示VM的性能的信息和资源的利用信息,使VM的动作环境从某物理主计算机交接至其他物理主计算机的技术(第IVM移动)、和使收纳于存储区域的VM向其他存储区域移动的技术(第2VM移动)。在此,VM为收纳于存储区域的数据的一种,VM移动(第IVM移动和第2VM移动)为存储区域间的数据移动的一种。另外,存储装置的数据存储区域(卷)间的数据移动技术(卷迁移)是已知的(参照专利文献3)。 现有技术文献 专利文献 专利文献1:美国专利第7107185号说明书 专利文献2:日本特开2010 - 86115号公报 专利文献3:美国专利第6108748号说明书
技术实现思路
在应对利用专利文献I那样的Event Correlat1n技术确定的故障的情况下,不论管理者具体实施哪种方法进行故障恢复,从故障至恢复均花费成本。 另外,为了应对利用Event Correlat1n技术确定的故障,能够存在如下情况:能够实施各种方案,如进行故障原因自身的恢复的方案、使因故障原因受到影响的业务的再开始为最优先的方案等。例如,在存储端口的性能故障导致业务的响应性能下降的情况下,具有以不利用产生了故障的端口的方式使业务转移至其他服务器的方案(例如关于VM移动的方案)、交换端口的方案等。 在实施不进行故障原因其自身的恢复的方案这样的对策的情况下,在实施方案后还可能继续残留因故障原因导致的危险,但是管理者并不知道在计算机系统内的哪处残留何种问题。因此,在有可能残留危险的情况下,管理者可能会无意地选择不进行故障原因其自身的恢复的方案(例如使业务的再开始为最优先的方案)。 用于解决技术课题的技术方案 对具有多个监视对象器件的计算机系统进行管理。管理系统的存储器件存储:通用规则,其表示与多个监视对象器件的任一个有关的I个以上的条件事件和在发生了I个以上的条件事件的情况下成为原因的、与多个监视对象器件的任一个有关的结论事件的对应关系,使与条件事件和结论事件有关联的监视对象器件通过该监视对象器件的类别表示;通用方案信息,其表示通用规则和作为在通用规则的结论事件为原因的情况下能够实施的恢复方案的I个以上的通用方案的对应关系;未解决信息,其按通用规则和通用方案的每个组合表示在实施了该通用方案的情况下以未解决的状态残留的、该通用规则的条件事件;和表示多个监视对象器件间的连接关系的结构信息。管理系统的控制器件,基于通用规则和结构信息,生成利用表示特定监视对象器件的数据来表示与条件事件和结论事件有关联的监视对象器件的类别而得到的多个展开规则,在发生了与多个监视对象器件的任一个有关的事件的情况下,基于生成的多个展开规则,将产生的事件作为条件事件进行原因分析,确定成为产生的事件的原因的候选的第I结论事件,基于通用方案信息,生成I个以上的展开方案,该I个以上的展开方案为在第I结论事件为原因的情况下能够实施的恢复方案、且为考虑计算机系统的实际结构将成为与包含第I结论事件的展开规则的基础的通用规则对应的通用方案展开而得到的恢复方案,对于生成的I个以上的展开方案,分别确定在基于未解决信息实施了该展开方案的情况下以未解决的状态残留的未解决事件,并确定危险部位,该危险部位是基于所确定的未解决事件实施了该展开方案后问题还继续残留的监视对象器件,显示第I结论事件、生成的I个以上的展开方案和表示所确定的危险部位的数据。 【附图说明】 图1是实施例1涉及的计算机系统的一个例子的构成图。 图2是实施例1涉及的管理服务器的一个例子的构成图。 图3是实施例1涉及的存储装置的一个例子的构成图。 图4是实施例1涉及的物理服务器的一个例子的构成图。 图5是实施例1涉及的结构信息表的一个例子的构成图。 图6是实施例1涉及的性能信息表的一个例子的构成图。 图7是实施例1涉及的事件管理表的一个例子的构成图。 图8是实施例1涉及的通用规则表的一个例子的构成图。 图9是实施例1涉及的通用方案表的一个例子的构成图。 图10是实施例1涉及的规则及方案对应表的一个例子的构成图。 图11是实施例1涉及的展开规则表的一个例子的构成图。 图12A是实施例1涉及的展开方案表的第I构成图。 图12B是实施例1涉及的展开方案表的第2构成图。 图13是实施例1涉及的分析结果管理表的一个例子的构成图。 图14是实施例1涉及的事件分析处理的流程图。 图15是实施例1涉及的规则展开处理的流程图。 图16是实施例1涉及的方案生成处理的流程图。 图17是实施例1涉及的方案执行后危险提取处理的流程图。 图18是实施例1涉及的方案提示处理的流程图。 图19是实施例1涉及的效果及危险提示处理的流程图。 图20是实施例1涉及的方案提示画面的一个例子的构成图。 图21是实施例1涉及的方案详细画面的一个例子的构成图。 图22是实施例2涉及的管理服务器的一个例子的构成图。 图23是实施例2涉及的物理服务器的一个例子的构成图。 图24是实施例2涉及的物理服务器的一个例子的逻辑构成图。 图25是实施例2涉及的交换机的一个例子的构成图。 图26是实施例2涉及的结构信息表的一个例子的构成图。 图27是实施例2涉及的VM结构管理表的一个例子的构成图。 图28是实施例2涉及的性能信息表的一个例子的构成图。 图29是实施例2涉及的事件管理表的一个例子的构成图。 图30A是实施例2涉及的通用规则表的第I构成图。 图30B是实施例2涉及的通用规则表的第2构成图。 图31是实施例2涉及的规则及方案对应表的一个例子的构成图。 图32A是实施例2涉及的展开规则表的第I构成图。 图32B是实施例2涉及的展开规则表的第2构成图。 图33A是实施例2涉及的展开方案表的第I构成图。 图33B是实施例2涉及的展开方案表的第2构成图。 图33C是实施例2涉及的展开方案表的第3构成图。 图34是实施例2涉及的分析结果管理表的一个例子的构成图。 图3本文档来自技高网
...

【技术保护点】
一种对具有多个监视对象器件的计算机系统进行管理的管理系统,其中,具有存储器件和与所述存储器件连接的控制器件,所述存储器件存储:通用规则,其表示与所述多个监视对象器件的任一个有关的1个以上的条件事件和在发生了所述1个以上的条件事件的情况下成为原因的、与所述多个监视对象器件的任一个有关的结论事件的对应关系,使与所述条件事件和所述结论事件有关联的监视对象器件通过该监视对象器件的类别表示;通用方案信息,其表示所述通用规则和作为在所述通用规则的结论事件为原因的情况下能够实施的恢复方案的1个以上的通用方案的对应关系;未解决信息,其按所述通用规则和所述通用方案的每个组合表示在实施了该通用方案的情况下以未解决的状态残留的、该通用规则的条件事件;和表示所述多个监视对象器件间的连接关系的结构信息,所述控制器件,基于所述通用规则和所述结构信息,生成利用表示特定监视对象器件的数据来表示与所述条件事件和所述结论事件有关联的监视对象器件的类别而得到的多个展开规则,在发生了与所述多个监视对象器件的任一个有关的事件的情况下,基于生成的所述多个展开规则,将产生的所述事件作为条件事件进行原因分析,确定成为产生的所述事件的原因的候选的第1结论事件,基于所述通用方案信息,生成1个以上的展开方案,该1个以上的展开方案为在所述第1结论事件为原因的情况下能够实施的恢复方案、且为考虑所述计算机系统的实际结构将成为与包含所述第1结论事件的展开规则的基础的通用规则对应的通用方案展开而得到的恢复方案,对于生成的所述1个以上的展开方案,分别确定在基于所述未解决信息实施了该展开方案的情况下以未解决的状态残留的未解决事件,并确定危险部位,该危险部位是基于所确定的所述未解决事件实施了该展开方案后问题还继续残留的监视对象器件,显示所述第1结论事件、生成的所述1个以上的展开方案和表示所确定的所述危险部位的数据。...

【技术特征摘要】
【国外来华专利技术】1.一种对具有多个监视对象器件的计算机系统进行管理的管理系统,其中, 具有存储器件和与所述存储器件连接的控制器件, 所述存储器件存储: 通用规则,其表示与所述多个监视对象器件的任一个有关的I个以上的条件事件和在发生了所述I个以上的条件事件的情况下成为原因的、与所述多个监视对象器件的任一个有关的结论事件的对应关系,使与所述条件事件和所述结论事件有关联的监视对象器件通过该监视对象器件的类别表示; 通用方案信息,其表示所述通用规则和作为在所述通用规则的结论事件为原因的情况下能够实施的恢复方案的I个以上的通用方案的对应关系; 未解决信息,其按所述通用规则和所述通用方案的每个组合表示在实施了该通用方案的情况下以未解决的状态残留的、该通用规则的条件事件;和表示所述多个监视对象器件间的连接关系的结构信息, 所述控制器件, 基于所述通用规则和所述结构信息,生成利用表示特定监视对象器件的数据来表示与所述条件事件和所述结论事件有关联的监视对象器件的类别而得到的多个展开规则, 在发生了与所述多个监视对象器件的任一个有关的事件的情况下,基于生成的所述多个展开规则,将产生的所述事件作为条件事件进行原因分析,确定成为产生的所述事件的原因的候选的第I结论事件, 基于所述通用方案信息,生成I个以上的展开方案,该I个以上的展开方案为在所述第I结论事件为原因的情况下能够实施的恢复方案、且为考虑所述计算机系统的实际结构将成为与包含所述第I结论事件的展开规则的基础的通用规则对应的通用方案展开而得到的恢复方案, 对于生成的所述I个以上的展开方案,分别确定在基于所述未解决信息实施了该展开方案的情况下以未解决的状态残留的未解决事件,并确定危险部位,该危险部位是基于所确定的所述未解决事件实施了该展开方案后问题还继续残留的监视对象器件, 显示所述第I结论事件、生成的所述I个以上的展开方案和表示所确定的所述危险部位的数据。2.如权利要求1所述的管理系统, 所述控制器件, 对于生成的所述I个以上的展开方案,分别确定与成为该展开方案的基础的通用方案和成为包含所述第I结论事件的第I展开规则的基础的通用规则的组合对应的以未解决的状态残留的条件事件, 将与所确定的该条件事件对应的所述第I展开规则的条件事件确定为所述未解决事件, 将与所确定的该未解决事件有关联的监视对象器件、以及和与所确定的该未解决事件有关联的监视对象器件具有连接关系的监视对象器件中的任意I个以上的监视对象器件确定为所述危险部位。3.如权利要求2所述的管理系统, 所述控制器件, 在与成为包含所述第I结论事件的第I展开规则的基础的通用规则对应的通用方案为卷迁移的情况下,生成与卷迁移有关的第I展开方案,该与卷迁移有关的第I展开方案以与所述第I展开规则的条件事件和结论事件的任一个有关联的、作为卷的监视对象器件为移动源卷,以与所述移动源卷具有连接关系的、作为卷的监视对象器件为移动目标卷, 对于所述第I展开方案,基于对所述移动源卷和所述移动目标卷的I/o的响应时间,计算所述第I展开方案实施后的、对所述移动源卷和所述移动目标卷的I/o的响应时间的预测值, 显示所述I/o的响应时间的预测值。4.如权利要求3所述的管理系统, 所述控制器件, 在与成为包含所述第I结论事件的第I展开规则的基础的通用规则对应的通用方案为对池追加盘的情况下,生成与对池追加盘有关的第I展开方案,该与对池追加盘有关的第I展开方案以与所述第I展开规则的条件事件和结论事件的任一个有关联的、作为池的监视对象器件为盘的追加对象的池, 对于所述第I展开方案,基于对所述追加对象的池的I/o的响应时间、和对所述追加对象的池追加盘前后的容量比,计算所述第I展开方案实施后的、对所述追加对象的池的I/o的响应时间的预测值, 显示所述I/o的响应时间的预测值。5.如权利要求4所述的管理系统, 所述控制器件, 对于生成的所述I个以上的展开方案,分别基于和与该展开方案有关联的监视对象器件相关的性能值,计算和与该展开方案有关联的监视对象器件有关的、该展开方案实施后的性能值的预测值, 还显示所述性能值的预测值。6.如权利要求5所述的管理系统, 所述控制器件将生成的所述I个以上的展开方案中的相同或相似的多个展开方案汇集为I个展开方案, 显示表示汇集的所述展开方案的数据。7.如权利要求6所述的管理系统, 所述存储器件还存储保养计划信息,该保养计划信息表示对所述多个监视对象器件的任一个进行的保养操作的计划, ...

【专利技术属性】
技术研发人员:中岛淳名仓正刚
申请(专利权)人:株式会社日立制作所
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1