提供能够缩短消除监视对象设备中的故障所需要的时间的故障解析功能。在故障原因解析处理中,在检测到处于异常状态的设备的状态正常化时,关于故障解析结果中的成为其导出根据的设备异常状态已消除的故障解析结果,与其他的解析结果区别地在GUI中进行显示。在通过多个故障事件导出多个故障解析结果时,在确认了全部的故障事件的正常化的时刻,与其他的故障解析结果区别地在GUI中进行显示(参照图16)。
【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及计算机系统的管理方法以及管理系统,例如涉及对构成计算机系统的主计算机、网络切换器以及存储系统的故障进行管理的技术。
技术介绍
在管理计算机系统时,例如像专利文献I所示那样,从在系统内检测到的多个故障或征兆中,检测成为原因的事项(事件)。更具体说,在专利文献I中,使用管理软件,将管理下设备中的性能值超过阈值事件化,在事件DB中积蓄信息。此外,该管理软件具有用于对在管理下设备中产生的多个故障事件的因果关系进行解析的解析引擎。该解析引擎访问具有管理下设备的事件信息的DB,识别位于I/O系统路径上的总线上的设备内构成要素,把对主机上的逻辑卷的性能造成影响的构成要素识别为被称为“拓扑”的组合。然后,解析引擎在发生了事件时对各拓扑应用由事前决定的条件句和解析结果构成的解析规则来构筑展开规则。在该展开规则中包含作为其他装置中的性能降低原因的原因事件和由于该原因事件引起的关联事件组。具体地说,在规则的THEN部中作为故障的根本原因而记载的事件是原因事件,在IF部中记载的事件中的原因事件以外的事件是关联事件。现有技术文献专利文献专利文献I :美国专利7107185号公报
技术实现思路
专利技术要解决的课题在专利文献I的故障解析功能中,把从管理对象设备接收的事件的组合和故障的原因候补记述为IF-THEN形式的规则。故障解析功能通过计算在规则的IF部中记载的事件的发生比例,计算在THEN部中记载的故障原因候补的确信度。根据用户的请求,对计算出的确信度和故障原因候补进行GUI显示。但是,在这样的现有的故障解析功能中,当在短期内频繁发生故障时,保存的故障解析结果的数量变多,作为管理者无法判断哪个故障是真正应该处理的故障。即,在现有的故障解析结果中没有与对策执行优先度有关的信息,所以直到管理者参照本来应该采取对策的解析结果的时间变长,结果消耗故障所需的时间变长。本专利技术是鉴于该状况而提出的,其目的地在于提供一种能够缩短消除监视对象设备中的故障所需要的时间的故障解析功能。解决课题的手段为了解决上述课题,在本专利技术中,在故障原因解析处理后,在检测到处于异常状态的设备的状态正常化时,关于故障解析结果中的成为其导出根据的设备异常状态已消除的故障解析结果,与其他的解析结果区别地在GUI中进行显示。在通过多个故障事件导出多个故障解析结果时,在确认了全部的故障事件的正常化的时刻,与其他的故障解析结果区别地在⑶I中进行显示。此外,在本专利技术中,在接收到在管理对象设备中与成为对业务带来障碍的事态无关地产生,并且在产生后迅速正常化的故障事件时,检测到处于异常状态的设备的状态正常化,在成为其导出根据的设备异常状态全部消除的时刻,将故障原因候补与确信度一同作为故障解析结果进行保存。此外,关于故障解析结果,与其他的解析结果区别地在GUI中进行显示。S卩,在本专利技术中,在管理服务器中,取得表示节点装置的处理性能的处理性能值,根据该取得的处理性能值检测节点装置的状态,把检测到的状态用于解析规则中,解析规则表示在节点装置中可能发生的一个以上的条件事件的组合与被看做条件事件的组合的根本原因的结论事件的关系。然后,计算表示在节点装置中发生故障的可能性的信息即确信度,根据确信度判断在节点装置中是否发生了故障。此外,在管理服务器中,对于被判断为发生了故障的节点装置,不改变确信度的信息,在显示画面中显示状态一直为异常的节点装置的故障解析结果即未解决故障解析结果和状态从异常变化为正常的节点装置的故 障解析结果即已解决故障解析结果。在显示解析结果时,可以将未解决故障解析结果和已解决故障解析结果相区别地在显示画面中显示,或者对于未解决故障解析结果和已解决故障解析结果,把处理优先度一同显示在显示画面中。根据以下用于实施本专利技术的实施方式以及附图,本专利技术的特征将会变得明确。专利技术的效果根据本专利技术,在向管理者(用户)提示故障解析结果时,通过反映并显示接收到的故障的正常化,管理者能够容易地判断解析结果的应对优先度,能够减轻解析结果确认的负担。附图说明图I表示计算机系统的物理结构例。图2表示主计算机的详细结构例。图3表示存储装置的详细结构例。图4表示管理服务器的详细结构例。图5表示管理服务器具有的装置性能管理表的结构例。图6表示管理服务器具有的卷拓扑管理表的结构例。图7表示管理服务器具有的事件管理表的结构例。图8A表示管理服务器具有的通用规则的结构例(I)。图SB表示管理服务器具有的通用规则的结构例(2)。图9A表示管理服务器具有的展开规则的结构例(I)。图9B表示管理服务器具有的展开规则的结构例(2)。图9C表示管理服务器具有的展开规则的结构例(3)。图9D表示管理服务器具有的展开规则的结构例(4)。图10表示管理服务器具有的解析结果管理表的结构例。图11是用于说明管理服务器实施的性能信息取得处理的概要的流程图。图12是用于说明管理服务器执行的故障解析处理的流程图。图13表示管理服务器具有的事件类别管理表的结构例。图14表示管理服务器具有的性能评价管理表的结构例。图15是用于说明在第一实施方式中,管理服务器执行的已解决事件反映处理的流程图。图16表示在第一实施方式中,管理服务器显示的故障解析结果画面的结构例。图17用于说明在第二实施方式中,管理服务器执行的瞬间故障事件反映处理的流程图。图18表示在第二实施方式中,管理服务器显示的故障解析结果画面的结构例。图19表示在实施例3中管理服务器具有的解析结果管理表的结构例。 图20用于说明在第三实施方式中,管理服务器执行的故障解析结果的处理优先度设定处理的流程图。图21表示在第三实施方式中,管理服务器显示的故障解析结果画面的结构例。具体实施例方式本专利技术的实施方式涉及带有故障消除的故障根本原因解析。以下参照附图对本专利技术的实施方式进行说明。但是,应该注意本实施方式仅是用于实现本专利技术的一个例子,并不限定本专利技术的技术范围。此外,对于在各图中公共的结构赋予相同的参照符号。在本说明书中,使用“ aaa表”的表现方式对在本专利技术中使用的信息进行说明,但是也可以通过“aaa表”、“aaa列表”、“aaaDB”、“aaa队列”的表现形式或表、列表、DB、队列等数据结构以外的数据结构来表现。因此,为了表示在本专利技术中使用的信息不依赖于数据结构,有时对于“aaa表”、“aaa列表”、“aaaDB”、“aaa队列”等称为“aaa信息”。此外,在说明各信息的内容时,使用“识别信息”、“识别符”、“名”、“名称”、“ID”这样的表现,但是它们可以相互置换。并且,在以后的本专利技术的处理动作的说明中,有时将“程序”或“模块”作为动作主体(主语)来进行说明,但是因为程序或模块通过处理器来执行,使用存储器以及通信端口(通信控制装置)进行已决定的处理,因此可以改称为将处理器作为动作主体(主语)的处理。此外,可以把以程序或模块作为主语而公开的处理作为管理服务器等计算机、信息处理装置进行的处理。可以通过专用硬件来实现程序的一部分或全部。此外,可以通过程序分发服务器或存储介质在各计算机中安装各种程序。(I)第一实施方式第一实施方式涉及基于管理软件(例如包含在管理服务器中)的已解决事件反映处理。(系统结构)图I表示本专利技术的计算机系统的物理结构。该计算机系统具有存储装置20000、主计算机本文档来自技高网...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】...
【专利技术属性】
技术研发人员:永井崇之,国井雅,增田峰义,黑田泽希,
申请(专利权)人:株式会社日立制作所,
类型:
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。