运用于数据中心的机柜异常状态的远端排除方法技术

技术编号:24888458 阅读:33 留言:0更新日期:2020-07-14 18:15
一种运用于数据中心的机柜异常状态的远端排除方法,由机柜服务器管理系统定时于远端取得一个机柜内的机柜管理控制器以及基板管理控制器的各项信息,并且记录管理者通过机柜服务器管理系统所进行的各项操作行为。机柜服务器管理系统对上述信息以及操作行为进行分析,以判断机柜内的机柜管理控制器或基板管理控制器是否处于预设的多种关注状态的其中之一。若判断任一机柜管理控制器或基板管理控制器连线正常但即将出现异常状态,则机柜服务器管理系统自动实施远端服务重启机制,以避免机柜管理控制器或基板管理控制器进入异常状态。

【技术实现步骤摘要】
运用于数据中心的机柜异常状态的远端排除方法
本专利技术涉及数据中心,尤其涉及对数据中心中的机柜的异常状态的分析与排除的方法。
技术介绍
一般来说,一个数据中心通常会通过智能型平台管理界面(IntelligentPlatformManagementInterface,IPMI)对数据中心内的机柜、端点服务器等设备的机柜管理控制器(RackManagementController,RMC)及基板管理控制器(BaseboardManagementController,BMC)进行远端管理。不论使用何种方式进行远端管理,只要任一机柜或端点服务器的RMC或BMC出现异常,管理者就会收到许多警告信件。然而,管理者一般难以通过这些警告信件在第一时间直接得知状态的真正问题点,往往需要随着时间不断推进,直到收到数百封警告信件并且与设备失去连线后,才能确定所述RMC、BMC发生了异常。更甚者,即使部分的管理平台从不同的监控管道收集到错误信息,并且进行汇整后提交故障评估报告给管理者,但这样的监控方式仍然需要由管理者进行最后的判断,并且决定处理方式。然而,只要有人为因素的介入,就无法全然避免误判的可能。有鉴于此,本领域确实需要发展一套新颖的系统与方法,可针对处于异常状态的RMC及BMC自动实施远端修复机制,藉此强化数据中心的监控能力,使得机柜管理能够高度自动化,同时减少人为判定所间接流失的时间,并且避免人为误判。
技术实现思路
本专利技术的主要目的,在于提供一种运用于数据中心的机柜异常状态的远端排除方法,可以在判断机柜管理控制器或基板管理控制器连线正常但判断可能即将出现异常状态时,直接于远端避免机柜管理控制器或基板管理控制器进入所述异常状态。为了达成上述的目的,本专利技术的远端排除方法是运用于具有一机柜及由远端与该机柜连接的一机柜服务器管理系统的一数据中心,其中该机柜具有一机柜管理控制器(RackManagementController,RMC)及多个端点服务器,各该端点服务器分别具有一基板管理控制器(BaseboardManagementController,BMC),该远端排除方法包括:a)该机柜服务器管理系统定时存取一数据库以取得该RMC及各该BMC的状态数据,并判断该RMC及各该BMC的状态变化;b)依据该状态数据及该状态变化判断该RMC及各该BMC的其中之一是否处于预设的多种关注状态的其中之一;及c)于判断任一RMC或BMC处于该多种关注状态中的一第二类关注状态时,该机柜服务器管理系统自动对处于该第二类关注状态的该RMC或该BMC实施一远端服务重启机制,以避免该RMC或该BMC进入一异常状态,其中该第二类关注状态指该RMC或该BMC与该机柜服务器管理系统的连线正常,但判断可能即将出现该异常状态。如上所述,其中更包括下列步骤:a01)该机柜服务器管理系统启动;a02)该步骤a01)后,该机柜服务器管理系统定时主动远程访问该机柜内的该RMC及各该BMC;a03)取得该RMC及各该BMC的该状态数据;a04)将该状态数据储存至该数据库;及a05)于该机柜服务器管理系统关闭前持续执行该步骤a02)至该步骤a04)。如上所述,其中更包括下列步骤:a11)该机柜服务器管理系统启动;a12)该步骤a11)后,该机柜服务器管理系统提供一操作界面;a13)于通过该操作界面接受一管理者的一操作行为时,依据该操作行为的内容对该RMC及各该BMC实施一远端管理程序;a14)取得该远端管理程序对应的反馈信息;a15)将该操作行为及该反馈信息储存至该数据库;及a16)于该机柜服务器管理系统关闭前持续执行该步骤a12)至该步骤a15)。如上所述,其中该步骤a)是取得该RMC及各该BMC目前的一智能平台管理界面(IntelligentPlatformManagementInterface,IPMI)的会话期间(session)总数,该步骤b)是于任一RMC或BMC的该IPMIsession总数高于一第一门槛值时,判断该RMC或该BMC处于该第二类关注状态。如上所述,其中该步骤a)还取得该RMC及各该BMC的一系统资源使用率,该步骤b)是于任一RMC或BMC的该IPMIsession总数高于该第一门槛值,并且该系统资源使用率高于一第二门槛值时,判断该RMC或该BMC处于该第二类关注状态。如上所述,其中该系统资源使用率为该RMC或该BMC的中央处理单元或记忆体的使用率。如上所述,其中该系统资源使用率为该RMC或该BMC主要用以提供HTTP服务或IPMI服务的系统资源的使用率。如上所述,其中该步骤c)是由该机柜服务器管理系统发出一控制指令至处于该第二类关注状态的该RMC或该BMC,以令该RMC或该BMC重启IPMI服务。如上所述,其中该步骤c)是由该机柜服务器管理系统发出一重置指令至处于该第二类关注状态的该RMC或该BMC,以强制该RMC或该BMC进行重置作业以重启IPMI服务。相对于相关技术,本专利技术的方法由与机柜连线的机柜服务器管理系统来进行分析并自动实施远端服务重启机制,无需等待管理者对于异常状态的人为判定,可大幅降低管理成本,亦使得机柜的监控无需人为干涉,也不受距离与时间的影响。以下结合附图和具体实施例对本专利技术进行详细描述,但不作为对本专利技术的限定。附图说明图1为本专利技术的数据中心的示意图;图2为本专利技术的机柜的方框图的第一具体实施例;图3A为本专利技术的数据搜集流程图的第一具体实施例;图3B为本专利技术的数据搜集流程图的第二具体实施例;图4为本专利技术的分析与排除流程图的第一具体实施例;图5为本专利技术的第一类关注状态排除流程图的第一具体实施例;图6为本专利技术的第一类关注状态排除流程图的第二具体实施例;图7为本专利技术的第二类关注状态排除流程图的第一具体实施例;图8为本专利技术的第三类关注状态排除流程图的第一具体实施例。其中,附图标记:1…数据中心;2…机柜;21…机柜管理控制器;211、221…网络接口控制器;22…基板管理控制器;23…内部网络交换机;24…内部硬件线路;3…机柜服务器管理系统;31…数据库;4…公共网络交换机;S11~S15、S21~S28…搜集步骤;S31~S39…分析与排除步骤;S41~S47、S51~S58、S61~S66、S71~S80…排除步骤。具体实施方式兹就本专利技术之一较佳实施例,配合附图,详细说明如后。本专利技术揭露了一种机柜异常状态的远端排除方法(下面将于说明书中简称为排除方法),所述排除方法主要运用于数据中心内,以协助管理者自动监控、分析并且排除数据中心内的异常状态。参阅图1,为本专利技术的数据中心的示意图。如图1所示,本专利技术所本文档来自技高网...

【技术保护点】
1.一种运用于数据中心的机柜异常状态的远端排除方法,运用于具有一机柜及由远端与该机柜连接的一机柜服务器管理系统的一数据中心,其中该机柜具有一RMC及多个端点服务器,各该端点服务器分别具有一BMC,其特征在于,该远端排除方法包括:/na)该机柜服务器管理系统定时存取一数据库以取得该RMC及各该BMC的状态数据,并判断该RMC及各该BMC的状态变化;/nb)依据该状态数据及该状态变化判断该RMC及各该BMC的其中之一是否处于预设的多种关注状态的其中之一;及/nc)于判断任一RMC或BMC处于该多种关注状态中的一第二类关注状态时,该机柜服务器管理系统自动对处于该第二类关注状态的该RMC或该BMC实施一远端服务重启机制,以避免该RMC或该BMC进入一异常状态,其中该第二类关注状态指该RMC或该BMC与该机柜服务器管理系统的连线正常,但判断可能即将出现该异常状态。/n

【技术特征摘要】
1.一种运用于数据中心的机柜异常状态的远端排除方法,运用于具有一机柜及由远端与该机柜连接的一机柜服务器管理系统的一数据中心,其中该机柜具有一RMC及多个端点服务器,各该端点服务器分别具有一BMC,其特征在于,该远端排除方法包括:
a)该机柜服务器管理系统定时存取一数据库以取得该RMC及各该BMC的状态数据,并判断该RMC及各该BMC的状态变化;
b)依据该状态数据及该状态变化判断该RMC及各该BMC的其中之一是否处于预设的多种关注状态的其中之一;及
c)于判断任一RMC或BMC处于该多种关注状态中的一第二类关注状态时,该机柜服务器管理系统自动对处于该第二类关注状态的该RMC或该BMC实施一远端服务重启机制,以避免该RMC或该BMC进入一异常状态,其中该第二类关注状态指该RMC或该BMC与该机柜服务器管理系统的连线正常,但判断可能即将出现该异常状态。


2.根据权利要求1所述的运用于数据中心的机柜异常状态的远端排除方法,其特征在于,更包括下列步骤:
a01)该机柜服务器管理系统启动;
a02)该步骤a01)后,该机柜服务器管理系统定时主动远程访问该机柜内的该RMC及各该BMC;
a03)取得该RMC及各该BMC的该状态数据;
a04)将该状态数据储存至该数据库;及
a05)于该机柜服务器管理系统关闭前持续执行该步骤a02)至该步骤a04)。


3.根据权利要求1所述的运用于数据中心的机柜异常状态的远端排除方法,其特征在于,更包括下列步骤:
a11)该机柜服务器管理系统启动;
a12)该步骤a11)后,该机柜服务器管理系统提供一操作界面;
a13)于通过该操作界面接受一管理者的一操作行为时,依据该操作行为的内容对该RMC及各该BMC实施一远端管理程序;
a14)取得该远端管理程序对应的反馈信息...

【专利技术属性】
技术研发人员:林韦成辛柏陞林政翰
申请(专利权)人:营邦企业股份有限公司
类型:发明
国别省市:中国台湾;71

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1