用于刀片服务器的双机热备的方法和装置制造方法及图纸

技术编号:5444505 阅读:718 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及用于刀片服务器的双机热备的方法和装置。本发明专利技术公开了一种双机热备方法,包括以下步骤:通过以太网接口对运行管理模块与备用管理模块的同步数据进行同步;监控运行管理模块的故障;当出现故障时,备用管理模块根据同步数据替代运行管理模块工作,其中,监控包括:步骤一,检查运行管理模块与备用管理模块之间的以太网接口是否有数据传输;步骤二,当在第一预定时间内以太网接口没有数据传输时,检查运行管理模块与备用管理模块之间的串口是否有数据传输;步骤三,当在第二预定时间内串口没有数据传输时,确定运行管理模块出现故障。此外,本发明专利技术还提供了一种双机热备装置。

【技术实现步骤摘要】

本专利技术总体涉及网络领域,更具体地,涉及用于刀片服务器的双机热备的方法和装置
技术介绍
在当前的刀片服务器应用中,管理模块的作用是毋庸置疑的。然而,由于系统自身 的稳定性以及诸如软硬件等原因,管理模块存在发生故障的可能。故障一旦发生,就会导致 刀片服务器不能正常运转。而修复系统是需要花费时间的,对于一些重要的业务入口或接 入点(企业、银行等),管理模块出现故障时,目前的系统存在着很大的风险。因此,市场上 急需一种具有备份机制的刀片服务器来避免这种情况发生。而对于其他领域的备份机制,如果直接应用于本专利技术,则会得到具有主备关系的 双机机制,即,双机热备机制。然而,这样的方案仍然存在很大的缺陷。例如无法自动监控 运行管理模块的故障;无法自动启动备用管理模块;无法在运行管理模块出现故障并开启 备用管理模块时保留之前接收、处理的数据资源等等。而这些不足会在时间和数据资源方 面造成极大的浪费,对刀片服务器的运行产生显著的不利影响。
技术实现思路
考虑到上述问题而做出本专利技术。本专利技术提供了一种双机热备方法,包括以下步骤通过以太网接口对运行管理模 块与备用管理模块的同步数据进行同步;监控运行管理模块的故障;当出现故障时,备用 管理模块根据同步数据替代运行管理模块工作,其中,监控包括步骤一,检查运行管理模 块与备用管理模块之间的以太网接口是否有数据传输;步骤二,当在第一预定时间内以太 网接口没有数据传输时,检查运行管理模块与备用管理模块之间的串口是否有数据传输; 步骤三,当在第二预定时间内串口没有数据传输时,确定运行管理模块出现故障。其中,步骤二进一步包括当在第一预定时间内以太网接口有数据传输时,返回步 马聚-““‘ο其中,步骤三进一步包括当在第二预定时间内串口有数据传输时,返回步骤一。其中,同步数据包括IP、时间。其中,监控进一步包括检查运行管理模块的处理器在第三预定时间内是否工作, 当处理器在第三预定时间内不工作时,确定出现故障。此外,本专利技术还提供了一种双机热备装置,包括同步模块,用于通过以太网接口 对运行管理模块与备用管理模块的同步数据进行同步;监控模块,用于监控运行管理模块 的故障;以及替代模块,用于在出现故障时使备用管理模块根据同步数据替代运行管理模 块工作,其中,监控模块包括第一检查子模块,用于检查运行管理模块与备用管理模块之 间的以太网接口在第一预定时间内是否有数据传输;第二检查子模块,用于在没有数据传 输时检查运行管理模块与备用管理模块之间的串口在第二预定时间内是否有数据传输;以及故障确定子模块,用于在没有数据传输时确定运行管理模块出现故障。其中,同步数据包括IP、时间。其中,监控模块进一步包括第三检查子模块,用于检查运行管理模块的处理器在 第三预定时间内是否工作,当处理器在第三预定时间内不工作时,确定出现故障。本专利技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变 得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点可通过在所写的说明 书、权利要求书、以及附图中所特别指出的结构来实现和获得。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本发 明的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中图1示出了根据本专利技术的示例性实施例的双机热备方法的流程图;图2示出了根据本专利技术的示例性实施例的双机热备方法中监控步骤的流程图;图3示出了根据本专利技术的示例性实施例的双机热备装置的框图;以及图4示出了根据本专利技术的示例性实施例的双机热备装置中监控模块的流程图。具体实施例方式下面将结合附图来详细说明本专利技术的实施例。图1示出了根据本专利技术的示例性实施例的双机热备方法的流程图。如图1所示, 双机热备方法可以包括S101,通过以太网接口对运行管理模块与备用管理模块的同步数 据进行同步;S103,监控运行管理模块的故障;S105,当出现故障时,备用管理模块根据同 步数据替代运行管理模块工作。其中,步骤S103可以具有多个子步骤。图2示出了根据本专利技术的示例性实施例的双机热备方法中监控步骤的流程图。如 图2所示,监控步骤S103包括S1031,检查运行管理模块与备用管理模块之间的以太网接 口是否有数据传输;S1033,当在第一预定时间内以太网接口没有数据传输时,检查运行管 理模块与备用管理模块之间的串口是否有数据传输;S1035,当在第二预定时间内串口没有 数据传输时,确定运行管理模块出现故障。其中,步骤S1033进一步包括当在第一预定时间内以太网接口有数据传输时,返 回步骤S1031。步骤S1035进一步包括当在第二预定时间内串口有数据传输时,返回步骤 S1031。而监控步骤S103进一步包括检查运行管理模块的处理器在第三预定时间内是 否工作,当处理器在第三预定时间内不工作时,确定出现故障。上述方法具有如下功能1)通过以太网接口,实现两个管理模块之间IP、时间等数据的同步。2)对两个管理模块经以太网及串口进行交互的双管理模块状态进行监控,出故障 时进行正确处理。3)在运行管理模块出故障时,备用管理模块能够根据保存的信息顺利升格为运行 管理模块,保证系统稳定运行硬件对于两个管理模块同时激活的情况还会有机制进行控制。即,当出现两个管理模块均激活的情况时,可以采取如下机制中的至少一种来进行控制1)停止所有管理模块的工作,并重新启动;2)根据预先设置的主备优先级对其中的主管理模块进行保持,并停止另一管理模 块的工作;3)对当前两个管理模块的性能进行评分,并根据预定策略选择一个管理模块为运 行管理模块,并停止另一管理模块的工作(例如,第一管理模块的性能高于第二管理模块 的性能,则第一管理模块为运行管理模块)。此外,图3示出了根据本专利技术的示例性实施例的双机热备装置的框图。如图3所 示,双机热备装置可以包括同步模块301,用于通过以太网接口对运行管理模块与备用管 理模块的同步数据进行同步;监控模块303,用于监控运行管理模块的故障;以及替代模块 305,用于在出现故障时使备用管理模块根据同步数据替代运行管理模块工作.而图4示出了根据本专利技术的示例性实施例的双机热备装置中监控模块的流程图。 如图4所示,监控模块303包括第一检查子模块3031,用于检查运行管理模块与备用管 理模块之间的以太网接口在第一预定时间内是否有数据传输;第二检查子模块3033,用于 在没有数据传输时检查运行管理模块与备用管理模块之间的串口在第二预定时间内是否 有数据传输;以及故障确定子模块3035,用于在没有数据传输时确定运行管理模块出现故 障。此外,监控模块303还可以包括第三检查子模块(未示出),用于检查运行管理 模块的处理器在第三预定时间内是否工作,当处理器在第三预定时间内不工作时,确定出 现故障。在本专利技术里,第一预定时间可以是60秒,第二预定时间可以是5秒,而第三预定时 间可以是小于1秒。当然,根据设计需求,这三个预定时间可以是相等或不等的。以上所述仅为本专利技术的优选实施例而已,并不用于限制本专利技术,对于本领域的技 术人员来说,本专利技术可以有各种更改和变化。凡在本专利技术的精神和原则之内,所作的任何修 改、等同替换、改进等,均应包含在本专利技术的保护范围之内。本文档来自技高网...

【技术保护点】
一种双机热备方法,其特征在于,所述方法包括以下步骤:通过以太网接口对运行管理模块与备用管理模块的同步数据进行同步;监控所述运行管理模块的故障;当出现故障时,所述备用管理模块根据所述同步数据替代所述运行管理模块工作,其中,所述监控包括:步骤一,检查所述运行管理模块与所述备用管理模块之间的所述以太网接口是否有数据传输;步骤二,当在第一预定时间内所述以太网接口没有数据传输时,检查所述运行管理模块与所述备用管理模块之间的串口是否有数据传输;步骤三,当在第二预定时间内所述串口没有数据传输时,确定所述运行管理模块出现故障。

【技术特征摘要】
1.一种双机热备方法,其特征在于,所述方法包括以下步骤通过以太网接口对运行管理模块与备用管理模块的同步数据进行同步; 监控所述运行管理模块的故障;当出现故障时,所述备用管理模块根据所述同步数据替代所述运行管理模块工作, 其中,所述监控包括步骤一,检查所述运行管理模块与所述备用管理模块之间的所述以太网接口是否有数 据传输;步骤二,当在第一预定时间内所述以太网接口没有数据传输时,检查所述运行管理模 块与所述备用管理模块之间的串口是否有数据传输;步骤三,当在第二预定时间内所述串口没有数据传输时,确定所述运行管理模块出现 故障。2.根据权利要求1所述的方法,其特征在于,所述步骤二进一步包括 当在所述第一预定时间内所述以太网接口有数据传输时,返回所述步骤一。3.根据权利要求1所述的方法,其特征在于,所述步骤三进一步包括 当在所述第二预定时间内所述串口有数据传输时,返回所述步骤一。4.根据权利要求1至3中任一项所述的方法,其特征在于,所述同步数据包括IP、时间。5.根据权利要求1至3中任一项所述的方法,其特征在于,所述监控进一步包括检查所述...

【专利技术属性】
技术研发人员:王峰郑谦张考华李华
申请(专利权)人:曙光信息产业北京有限公司
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1