运用于数据中心的机柜异常状态的远端排除方法技术

技术编号:24893524 阅读:63 留言:0更新日期:2020-07-14 18:19
一种运用于数据中心的机柜异常状态的远端排除方法,由机柜服务器管理系统定时于远端取得一个机柜内的机柜管理控制器以及基板管理控制器的各项信息,并且记录管理者通过机柜服务器管理系统所进行的各项操作行为。机柜服务器管理系统对上述信息以及操作行为进行分析,以判断机柜内的机柜管理控制器或基板管理控制器是否处于预设的多种关注状态的其中之一。若判断任一基板管理控制器失去了与机柜服务器管理系统间的连线,则机柜服务器管理系统自动实施远端救援机制,以排除基板管理控制器失去网络连线的异常状态。

【技术实现步骤摘要】
运用于数据中心的机柜异常状态的远端排除方法
本专利技术涉及数据中心,尤其涉及对数据中心中的机柜的异常状态的分析与排除的方法。
技术介绍
一般来说,一个数据中心通常会通过智能型平台管理界面(IntelligentPlatformManagementInterface,IPMI)对数据中心内的机柜、端点服务器等设备的机柜管理控制器(RackManagementController,RMC)及基板管理控制器(BaseboardManagementController,BMC)进行远端管理。不论使用何种方式进行远端管理,只要任一机柜或端点服务器的RMC或BMC出现异常,管理者就会收到许多警告信件。然而,管理者一般难以通过这些警告信件在第一时间直接得知状态的真正问题点,往往需要随着时间不断推进,直到收到数百封警告信件并且与设备失去连线后,才能确定所述RMC、BMC发生了异常。更甚者,即使部分的管理平台从不同的监控管道收集到错误讯息,并且进行汇整后提交故障评估报告给管理者,但这样的监控方式仍然需要由管理者进行最后的判断,并且决定处理方式。然而,只要有人为因素的介入,就无法全然避免误判的可能。有鉴于此,本领域确实需要发展一套新颖的系统与方法,可针对处于异常状态的RMC及BMC自动实施远端修复机制,藉此强化数据中心的监控能力,使得机柜管理能够高度自动化,同时减少人为判定所间接流失的时间,并且避免人为误判。
技术实现思路
本专利技术的主要目的,在于提供一种运用于数据中心的机柜异常状态的远端排除方法,可以在判断基板管理控制器失去了与机柜服务器管理系统间的连线时,直接于远端排除基板管理控制器的异常状态。为了达成上述的目的,本专利技术的远端排除方法是运用于具有一机柜及由远端与该机柜连接的一机柜服务器管理系统的一数据中心,其中该机柜具有一机柜管理控制器(RackManagementController,RMC)及多个端点服务器,各该端点服务器分别具有一基板管理控制器(BaseboardManagementController,BMC),该远端排除方法包括:a)该机柜服务器管理系统定时存取一数据库以取得各该BMC的状态数据、一管理者通过该机柜服务器管理系统对该机柜所实施的操作行为以及对应该操作行为所获得的反馈信息;b)依据该状态数据、该操作行为及该反馈信息判断各该BMC的其中之一是否处于预设的多种关注状态的其中之一;及c)于判断任一BMC处于该多种关注状态中的一第三类关注状态时,该机柜服务器管理系统自动对处于该第三类关注状态的该BMC实施一远端救援机制,以排除该BMC失去网络连线的异常状态,其中该第三类关注状态指该BMC失去了与该机柜服务器管理系统间的连线。如上所述,其中更包括下列步骤:a01)该机柜服务器管理系统启动;a02)该步骤a01)后,该机柜服务器管理系统定时主动远程访问该机柜内的该RMC及各该BMC;a03)取得该RMC及各该BMC的该状态数据;a04)将该状态数据储存至该数据库;及a05)于该机柜服务器管理系统关闭前持续执行该步骤a02)至该步骤a04)。如上所述,其中更包括下列步骤:a11)该机柜服务器管理系统启动;a12)该步骤a11)后,该机柜服务器管理系统提供一操作界面;a13)于通过该操作界面接受该管理者的该操作行为时,依据该操作行为的内容对该RMC及各该BMC实施一远端管理程序;a14)取得该远端管理程序对应的该反馈信息;a15)将该操作行为及该反馈信息储存至该数据库;及a16)于该机柜服务器管理系统关闭前持续执行该步骤a12)至该步骤a15)。如上所述,其中该状态数据至少包括各该BMC的网络模式、IP地址、子网络遮罩及闸道器IP地址。如上所述,其中该反馈信息包括执行该操作行为时,该机柜服务器管理系统、该机柜、各该端点服务器、该RMC及各该BMC分别产生的反馈、系统参数及执行数据。如上所述,其中该步骤b)包括下列步骤:b1)依据该状态数据及该反馈信息判断各该BMC的其中之一是否失去与该机柜服务器管理系统间的连线;b2)依据该操作行为判断各该BMC的其中之一是否刚刚实施一网络设定作业;及b3)于任一BMC刚刚实施了该网络设定作业,并于该网络设定作业后失去连线时,视为该BMC处于该第三类关注状态。如上所述,其中该该步骤b1)是于任一BMC的网络模式设定为一静态IP模式,并且该BMC的静态IP地址与该数据中心内的一动态主机设定协定(DynamicHostConfigurationProtocol,DHCP)服务器所配发的多组动态IP地址的其中之一重复时,判断该BMC失去连线。如上所述,其中该步骤b1)是于任一BMC的网络模式设定为一静态IP模式,并且该BMC的闸道器IP地址设定错误时,判断该BMC失去连线。如上所述,其中该步骤c包括下列步骤:c1)于判断任一BMC处于该第三类关注状态时,判断并连接至主要负责该BMC的该RMC;c2)控制该RMC通过该机柜的一内部硬件线路检查该BMC所属的该端点服务器,其中该RMC通过该内部硬件线路实体连接该机柜内的所有该BMC;c3)于该端点服务器不存在时发出一警示信号;及c4)于该端点服务器存在时,控制该RMC通过该内部硬件线路发送一智能平台管理界面(IntelligentPlatformManagementInterface,IPMI)指令至该BMC,以令该BMC恢复与该机柜服务器管理系统间的连线。如上所述,其中该步骤c4)是通过该IPMI指令重新设定该BMC的静态IP地址,或重新设定该BMC的闸道器IP地址。相对于相关技术,本专利技术的方法由与机柜连线的机柜服务器管理系统来进行分析并自动实施远端救援机制,无需等待管理者对于异常状态的人为判定,可大幅降低管理成本,亦使得机柜的监控无需人为干涉,也不受距离与时间的影响。以下结合附图和具体实施例对本专利技术进行详细描述,但不作为对本专利技术的限定。附图说明图1为本专利技术的数据中心的示意图;图2为本专利技术的机柜的方框图的第一具体实施例;图3A为本专利技术的数据搜集流程图的第一具体实施例;图3B为本专利技术的数据搜集流程图的第二具体实施例;图4为本专利技术的分析与排除流程图的第一具体实施例;图5为本专利技术的第一类关注状态排除流程图的第一具体实施例;图6为本专利技术的第一类关注状态排除流程图的第二具体实施例;图7为本专利技术的第二类关注状态排除流程图的第一具体实施例;图8为本专利技术的第三类关注状态排除流程图的第一具体实施例。其中,附图标记:1…数据中心;2…机柜;21…机柜管理控制器;211、221…网络接口控制器;22…基板管理控制器;23…内部网络交换机;24…内部硬件线路;本文档来自技高网...

【技术保护点】
1.一种运用于数据中心的机柜异常状态的远端排除方法,运用于具有一机柜及由远端与该机柜连接的一机柜服务器管理系统的一数据中心,其中该机柜具有一RMC及多个端点服务器,各该端点服务器分别具有一BMC,其特征在于,该远端排除方法包括:/na)该机柜服务器管理系统定时存取一数据库以取得各该BMC的状态数据、一管理者通过该机柜服务器管理系统对该机柜所实施的操作行为以及对应该操作行为所获得的反馈信息;/nb)依据该状态数据、该操作行为及该反馈信息判断各该BMC的其中之一是否处于预设的多种关注状态的其中之一;及/nc)于判断任一BMC处于该多种关注状态中的一第三类关注状态时,该机柜服务器管理系统自动对处于该第三类关注状态的该BMC实施一远端救援机制,以排除该BMC失去网络连线的异常状态,其中该第三类关注状态指该BMC失去了与该机柜服务器管理系统间的连线。/n

【技术特征摘要】
1.一种运用于数据中心的机柜异常状态的远端排除方法,运用于具有一机柜及由远端与该机柜连接的一机柜服务器管理系统的一数据中心,其中该机柜具有一RMC及多个端点服务器,各该端点服务器分别具有一BMC,其特征在于,该远端排除方法包括:
a)该机柜服务器管理系统定时存取一数据库以取得各该BMC的状态数据、一管理者通过该机柜服务器管理系统对该机柜所实施的操作行为以及对应该操作行为所获得的反馈信息;
b)依据该状态数据、该操作行为及该反馈信息判断各该BMC的其中之一是否处于预设的多种关注状态的其中之一;及
c)于判断任一BMC处于该多种关注状态中的一第三类关注状态时,该机柜服务器管理系统自动对处于该第三类关注状态的该BMC实施一远端救援机制,以排除该BMC失去网络连线的异常状态,其中该第三类关注状态指该BMC失去了与该机柜服务器管理系统间的连线。


2.根据权利要求1所述的运用于数据中心的机柜异常状态的远端排除方法,其特征在于,更包括下列步骤:
a01)该机柜服务器管理系统启动;
a02)该步骤a01)后,该机柜服务器管理系统定时主动远程访问该机柜内的该RMC及各该BMC;
a03)取得该RMC及各该BMC的该状态数据;
a04)将该状态数据储存至该数据库;及
a05)于该机柜服务器管理系统关闭前持续执行该步骤a02)至该步骤a04)。


3.根据权利要求1所述的运用于数据中心的机柜异常状态的远端排除方法,其特征在于,更包括下列步骤:
a11)该机柜服务器管理系统启动;
a12)该步骤a11)后,该机柜服务器管理系统提供一操作界面;
a13)于通过该操作界面接受该管理者的该操作行为时,依据该操作行为的内容对该RMC及各该BMC实施一远端管理程序;
a14)取得该远端管理程序对应的该反馈信息;
a15)将该操作行为及该反馈信息储存至该数据库;及
a16)于该机柜服务器管理系统关闭前持续执行该步骤a12)至该步骤a15)。


4.根据权利要求1所述的运用于数据中心的机柜异常状态的远端排除方法,其特征在于,该状态数据至少包括各该BMC的网络模式、IP地址、子网络遮罩及闸道器IP地址。
...

【专利技术属性】
技术研发人员:林韦成辛柏陞林政翰
申请(专利权)人:营邦企业股份有限公司
类型:发明
国别省市:中国台湾;71

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1