信息处理设备和操作状态监视方法技术

技术编号:8907044 阅读:175 留言:0更新日期:2013-07-11 04:42
本发明专利技术公开了一种信息处理设备和操作状态监视方法。该信息处理设备包括能够彼此进行通信的多个控制器模块,每个控制器模块包括要关于通信对方设备的控制器模块和/或设备自身的控制器模块存储状态信息的存储器,该状态信息反映在与其它的控制器模块通信期间出现错误的状态。当确定多个控制器模块中的控制器模块中是否出现故障时,不同于确定目标控制器模块的控制器模块基于存储在不同于所述确定目标控制器模块的两个或更多个控制器模块的存储器上的所述确定目标控制器模块的状态信息来确定在所述确定目标控制器模块中是否出现故障。

【技术实现步骤摘要】

本专利技术涉及一种包括能够彼此进行通信的多个控制器模块的信息处理设备和监视能够彼此进行通信的多个控制器模块的操作状态的操作状态监视方法。
技术介绍
在信息处理设备中,存在每一个均包括能够彼此进行通信的多个控制器模块的一些设备,其中如果某一控制器模块发生故障,则通过将这个控制器模块从其它部分拆卸来持续操作。这种信息处理设备配置为:通常一个模块(控制器模块或者状态监视模块)确定(判定)哪个部件(控制器模块、控制器模块中的电路等)发生故障。然而,在一个模块确定每个部件是否发生故障的设备中,如果这个模块发生故障,则出现“实际上正常的部件被错误地确定为具有故障然后被拆卸”和“因为故障部件没有被拆卸,所以该设备无法正常地运行”的这样的情况。因此,已经开发出这样的信息处理设备(下文中称为传统设备):多个控制器模块中的每一个监视每个部件的状态,并且指定的控制器模块基于全部控制器模块的监视结果来确定哪个部件是故障部件。现有技术文献专利文献1:日本专利公开公报N0.2007-249741专利文献2:日本专利公开公报N0.Hl 1-249931专利文献3:日本专利公开公报N0.2001-7892如上所述的传统设备是如下的设备:其中与指定的控制器模块(下文中称为主控制器模块)通信失败的控制器模块(下文中称为发送器模块)单独地确定主控制器模块是否发生故障。即,传统设备是如下的设备:即使当与主控制器模块通信失败是由发送器模块一侧的故障所引起,并且如果发送器模块不能识别出这个故障,则主控制器模块被错误地确定为具有故障并且然后被拆卸。
技术实现思路
在这样的情况下,根据一个方面,本专利技术的目的是更准确地确定能够彼此进行通信的多个控制器模块的状态。根据本公开的技术的一个方面,信息处理设备包括能够彼此进行通信的多个控制器模块,每个控制器模块包括要关于通信对方设备的控制器模块和/或所述设备自身的控制器模块存储状态信息的存储器,所述状态信息反映与其它控制器模块通信期间出现错误的状态。当确定所述多个控制器模块中的某一控制器模块中是否出现故障时,不同于确定目标控制器模块的所述控制器模块基于存储在不同于所述确定目标控制器模块的两个或更多个控制器模块的所述存储器上的所述确定目标控制器模块的状态信息来确定在所述确定目标控制器模块中是否出现故障。此外,根据本公开的技术的另一方面的操作状态监视方法是一种用于监视能够彼此进行通信的多个控制器模块的操作状态的操作状态监视方法,其中每个控制器模块包括要关于通信对方设备的控制器模块和/或所述设备自身的控制器模块存储状态信息的存储器,所述状态信息反映与其它控制器模块通信期间出现错误的状态,以及当确定所述多个控制器模块中的某一控制器模块中是否出现故障时,不同于确定目标控制器模块的所述控制器模块基于存储在不同于所述确定目标控制器模块的两个或更多个控制器模块的所述存储器上的所述确定目标控制器模块的状态信息来确定在所述确定目标控制器模块中是否出现故障。应理解,上面的概述和以下的详细说明都是示例性的和说明性的并且对本专利技术不是限制性的。根据一个实施例,更准确地确定能够彼此进行通信的多个控制器模块的状态是可行的。附图说明图1是通过利用根据第一实施例的信息处理设备建立的存储系统的配置的示例的说明图。图2是配备在根据第一实施例的信息处理设备中的CM的配置的示意图。图3是每个CM执行的主CM指定处理的流程图。图4是当通信错误出现时每个从CM执行的用于从CM的错误处理的流程图。图5是配备在每个CM中的状态值表的说明图。图6是每个CM保留的点增加信息的说明图。图7是当通信错误出现时主CM执行的用于主CM的错误处理的流程图。图8是当接收到状态值表时主CM执行的用于接收该表时的处理的流程图。图9是当接收到状态值表时下一个主CM执行的用于接收该表时的处理的流程图。图10是下一个主CM执行的生存检查处理的流程图。图11是在从CM发生故障的情况下根据第一实施例的信息处理设备的操作的内容的说明图。图12是在主CM发生故障的情况下根据第一实施例的信息处理设备的操作的内容的说明图。图13是当接收到根据第二实施例的信息处理设备中的状态值表时下一个主CM执行的用于接收该表格时的处理的流程图。具体实施例方式下文中将参考附图来详细描述本专利技术的实施例。应注意:下文中将描述的第一和第二实施例的每一个不过是本专利技术的一个示例,以具体的配置和过程与各个实施例中的配置和过程不同的这样的方式也能够实现本专利技术。《第一实施例》首先,将利用图1和图2描述根据第一实施例的信息处理设备10的使用模式、其硬件配置及其基本操作(功能)。顺便一提,图1是利用信息处理设备10所建立的存储系统的架构的示例的说明图。此外,图2是信息处理设备10所配备的CM(Controller Module,控制器模块)11的每一个的配置的示意图。根据第一实施例的信息处理设备10是用于建立如图1所示的存储系统的设备。在这个存储系统中的DE (Drive Enclosure,驱动器机柜)16的每一个是配置为将多个(小于或等于指定数量的)驱动器安装到体单元中的单元,所述体单元能够安装有多达指定数量的驱动器(硬盘驱动器或者固态驱动器)。EXP (expander,扩展器)15的每一个是用于在CM 11和DE16之间建立连接的多端口交换机(在第一实施例中其是SAS(SerialAttached SCSI,串行连接 SCSI (Small Computer System Interface,小型计算机系统接口))。当建立该存储系统时,通常EXP 15设置在信息处理设备10和多个DE 16之间,该EXP 15的数量和规格(端口数)使信息处理设备10内的各个CM 11能够连接到(全部)DE 16中的任意数量的DE 16。信息处理设备10是使存储系统(多个DE 16经由多个EXP15连接到信息处理设备10本身)内的所有驱动器用作多个RAID (Redundant Array of Independent (orInexpensive) Disks,独立(或经济)磁盘冗余阵列)的设备。如图1所不,信息处理设备10包括8个CM 11和4个FRT (Front-end Routers,前端路由器)12。应注意:图1示出了 8个CM 11,然而,信息处理设备10是可向其附接和可从其拆卸CM 11的设备并且是能够以仅安装有数量少于“8”的CM 11的形式而操作的设备。下文中,信息处理设备10中的各个CM 11也将以诸如CM#n(n=0到7)的符号表示。此夕卜,下文中,信息处理设备10中的各个FRT12也将以诸如FRT#m (m=0到3)的符号表示。信息处理设备10中的每个CM 11是从主机(未示出)接收对于每个RAID (任意的RAID)的读出/写入请求的模块,并且具有对每个RAID的具有对应于所接收的读出/写入请求的内容的读出/写入访问。应注意:每个CM 11所接收的读出/写入请求精确地说不是“对于某一 RAID的读出/写入请求”,而是“对于分配给RAID中的任何一个的某一逻辑卷的读出/写入请求”。如图2所示,CM 11包括4个DMA (Direct Memory Access,直接存储器访问)端口(图 2 中的 “DMA”)21本文档来自技高网...

【技术保护点】
一种包括能够彼此进行通信的多个控制器模块的信息处理设备,其中每个控制器模块包括要关于通信对方设备的控制器模块和/或所述设备自身的控制器模块存储状态信息的存储器(26),所述状态信息反映与其它控制器模块通信期间出现错误的状态,当确定所述多个控制器模块中的某一控制器模块中是否出现故障时,不同于确定目标控制器模块的所述控制器模块基于存储在不同于所述确定目标控制器模块的两个或更多个控制器模块的所述存储器上的所述确定目标控制器模块的状态信息来确定在所述确定目标控制器模块中是否出现故障。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:原田经道佐藤弘章三瓶明榛泽文夫
申请(专利权)人:富士通株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1