将固件更新应用在具有零停机时间的系统中技术方案

技术编号:13829789 阅读:100 留言:0更新日期:2016-10-13 16:22
本公开的实施例涉及通过使用升级向上扩展管理程序层使得硬件选择性地离线和在线来将固件更新应用在具有零停机时间的系统中。一种方法,包括:在包括至少一个服务器的服务器复合体上运行向上扩展管理程序,并且运行单个操作系统和在向上扩展管理程序之上的至少一个应用。该方法还包括标识可用于服务器复合体内的第一硬件部件的固件更新。向上扩展管理程序从第一硬件部件移除所有工作负荷,并且当第一硬件部件空闲并且管理程序继续运行单个操作系统和至少一个应用时,所标识的固件更新被应用到第一硬件部件。优选地,该方法可以被用于在未曾关闭全部多个服务器的情况下,将固件更新顺序地应用到在多个服务器上的各个硬件部件。

【技术实现步骤摘要】

本专利技术涉及用于更新服务器的硬件部件中的固件的方法和系统。
技术介绍
数据中心是针对集中操作和管理合并计算机设备和相关基础设施的设施。计算机设备可以与数据中心相互连接来产生大型的强大的计算机系统,其能够存储和处理针对实体(诸如大型企业、web托管服务和因特网搜索引擎)的大量的数据。数据中心可以安置任何数目的机架,每个机架能够保持大量的服务器和支持设备,诸如交换机、电源、网络通信接口、环境控制和安全设备。服务器和支持设备通常安置在机架式多服务器外壳(例如,多叶底架)中并且以高密度配置被布置。所需要的多个服务器和机架式外壳可以相互连接来产生具有期望的性能的系统。个人和企业想要其计算机应用经历零停机时间来避免对其繁忙日程、商业目标和顾客需求的影响。这向保持服务窗口很小施加了压力,使得所需要的维护和更新常常尽可能地被延迟。例如,服务器或者服务器的集群可以利用已经长期过时的固件版本运行。未更新部件的主要原因在于,更新固件的任务通常花费大量的时间段完成并且然后可能要求服务器重新启动。遗憾的是,继续运行旧固件意味着系统可靠性随时间下降,这是因为关键更新修复未得到应用。这种类型的可靠性下降是甚至针对频繁地释放关键更新修复的复合体扩展系统的特定关心问题。使得针对固件更新的复合体扩展系统离线可能导致服务的完全中断,这是因为出于该目的安装冗余扩展 系统是成本过高的。
技术实现思路
本专利技术的一个实施例提供一种方法,包括:在包括至少一个服务器的服务器复合体上运行向上扩展管理程序,并且运行单个操作系统和在向上扩展管理程序之上的至少一个应用。该方法还包括标识可用于服务器复合体内的第一硬件部件的固件更新。向上扩展管理程序从第一硬件部件移除所有工作负荷,并且当第一硬件部件空闲时并且管理程序继续运行单个操作系统和至少一个应用时,所标识的固件更新被应用到第一硬件部件。附图说明图1是使用适于更新集群的各个计算节点和部件的固件的向上扩展管理程序的计算机集群的示图。图2是根据本专利技术的各种实施例的可以使用的计算节点的示图。图3是确定固件更新的定时和范围的过程的示意图。图4是经由基板管理控制器(BMC)更新固件的带外(OOB)过程的示意图。图5是经由操作系统(OS)更新固件的带内(IB)过程的示意图。图6是经由操作系统(OS)和基板管理控制器(BMC)更新固件的带内(IB)过程的示意图。图7是表示固件更新包的表。图8是表示包括使用固件的每个硬件设备的已安装的固件版本的标识的每个服务器或者计算节点的重要产品数据(VPD)的一组表。图9A-D是图示从服务器元件移除工作负荷(图9A)、使得服务器元件离线(图9B)、更新服务器元件上的固件(图9C)和使得服务器元件恢复在线以处置工作负荷(图9D)的过程的示意图。图10是顺序地更新多个服务器元件上的固件的方法的流程图。具体实施方式本专利技术的一个实施例提供一种方法,包括:在包括至少一个服务器的服务器复合体上运行向上扩展管理程序,并且运行单个操作系统和在向上扩展管理程序之上的至少一个应用。该方法还包括标识可用于服务器复合体内的第一硬件部件的固件更新。向上扩展管理程序从第一硬件部件移除所有工作负荷,并且当第一硬件部件空闲并且管理程序继续运行单个操作系统和至少一个应用时,所标识的固件更新被应用到第一硬件部件。向上扩展管理程序可以运行在包括单个服务器的服务器复合体上或者包括多个服务器的服务器复合体上,多个服务器创建对操作系统(OS)看起来像单个服务器的大型对称多处理器(SMP)。这有时被称为SMP缩放。本专利技术的实施例将向上扩展管理程序利用在将固件更新应用到服务器复合体中的任何硬件部件的方法中。如本文所公开的,向上扩展管理程序可以从任何一个硬件部件或者服务器移除工作负荷,来促进相关固件的更新或者修复,同时继续运行服务器复合体上的操作系统和应用。换句话说,在应用没有经历任何停机时间的情况下,可以将所标识的固件更新应用到第一硬件部件。本专利技术的各种实施例的有益方面在于,可以将固件更新顺序地应用到在服务器复合体上的硬件部件。可选地,该方法还可以包括:在已经完成对第一硬件部件的所标识的固件更新之后,向上扩展管理程序将工作负荷分配给第一硬件部件。因此,当更新第一硬件部件的固件时,第一硬件部件的容量仅在很短时间段是不可用的。在另一选择中,方法还可以包括标识可用于服务器复合体内的第二硬件部件的固件更新,向上扩展管理程序将工作负荷从第二硬件部件移除到服务器复合体内的一个或多个其他硬件部件,并且将所标识的固件更新应用到第二硬件部件,同时管理程序继续运行服务器复合体上的操作系统和应用。类似地, 本专利技术的方法可以从任何一个或多个硬件部件顺序地移除工作负荷,并且在更新任何进一步的硬件部件的固件之前,更新一个或多个硬件部件上的固件。应当认识到,如果服务器复合体包括多个服务器并且将工作负荷从整个服务器移除,那么可以同时将固件更新应用到该服务器上的硬件部件中的任何或者全部硬件部件。在另一实施例中,该方法还可以包括:向上扩展管理程序将所有工作负荷从服务器复合体内的第一服务器移除,然后在已经从第一服务器移除所有工作负荷之后,使得第一服务器离线。在所标识的固件更新已经被完成之后,该方法可以使得第一服务器恢复在线并且将工作负荷分配给第一服务器。可选地,可以将所标识的固件更新应用到第一服务器上的处理器。更进一步地,当服务器已经被使得离线时,可以期望的是,将固件更新应用到该服务器上的、固件更新可用的任何硬件部件。利用服务器离线,电力还可用于平台管理模块(即,基板管理控制器(BMC))或者集成管理模块(IMM)),并且应用可以通过平台管理模块处理的任何固件更新是可能的。例如,管理员可以通过网络将指令和固件更新传递给平台管理模块。该方法还可以包括向上扩展管理程序将针对每个服务器或者硬件部件的系统资源使用数据传递给每个服务器上的平台管理模块。响应于来自平台管理模块的请求或者响应于资源使用到达预先确定的设定点,可以以定期的时间间隔传递这样的数据。可选地,该方法可以响应于针对所有服务器的系统资源使用小于预定数量的系统资源使用而发起固件更新。更进一步地,可以根据一天中的时间、一周中的一天或者一年中的一天对系统资源使用进行建模,使得可以预测或者计划用于应用固件更新的适当的时间。可以由管理员模块使用经由操作系统或者平台管理模块从向上扩展管理程序所接收的系统资源使用数据来准备这样的建模。一个优选的方法包括:请求平台管理模块在建模期望小于预定数量的系统资源使用的系统资源使用的时间处报告当前系统资源使用,并且如果平台管理模块指示当前系统资源使用小于预定数量的系统资源使用,则发起固件更 新。在特定选择中,平台管理模块可以请求向上扩展管理程序提供针对由管理员模块标识为具有可用的固件更新的一个或多个硬件部件的系统资源使用。本专利技术的实施例可以包括操作系统将固件更新应用到第一服务器的第一硬件部件。此外,平台管理模块可以将固件更新应用到第一服务器的第二硬件部件。可以通过操作系统或平台管理模块应用任何单独的固件更新,这取决于服务器的配置。此外,可以通过操作系统、平台管理模块或者操作系统和平台管理模块二者应用包括针对服务器的多个硬件部件的固件更新的固件更新包。应当认识到,服务器的一些硬件部件可本文档来自技高网...

【技术保护点】
一种方法,包括:在包括至少一个服务器的服务器复合体上运行向上扩展管理程序;运行单个操作系统和所述向上扩展管理程序之上的至少一个应用;标识可用于所述服务器复合体内的第一硬件部件的固件更新;所述向上扩展管理程序从所述第一硬件部件移除所有工作负荷;以及当所述第一硬件部件空闲并且所述管理程序继续运行所述单个操作系统和所述至少一个应用时,将所标识的固件更新应用到所述第一硬件部件。

【技术特征摘要】
2015.03.24 US 14/667,2591.一种方法,包括:在包括至少一个服务器的服务器复合体上运行向上扩展管理程序;运行单个操作系统和所述向上扩展管理程序之上的至少一个应用;标识可用于所述服务器复合体内的第一硬件部件的固件更新;所述向上扩展管理程序从所述第一硬件部件移除所有工作负荷;以及当所述第一硬件部件空闲并且所述管理程序继续运行所述单个操作系统和所述至少一个应用时,将所标识的固件更新应用到所述第一硬件部件。2.根据权利要求1所述的方法,其中所述向上扩展管理程序从所述第一硬件部件移除所有工作负荷包括:所述向上扩展管理程序将所有工作负荷从所述第一硬件部件迁移到所述服务器复合体内的至少一个其他硬件部件,其中所述第一硬件部件和所述至少一个其他硬件部件是相同类型的部件。3.根据权利要求1所述的方法,其中所述向上扩展管理程序从所述第一硬件部件移除所有工作负荷包括:在不向所述第一硬件部件分配任何附加工作负荷的情况下,所述向上扩展管理程序允许所述第一硬件部件完成当前工作负荷。4.根据权利要求1所述的方法,其中在所述应用没有经历任何停机时间的情况下,所标识的固件更新被应用到所述第一硬件部件。5.根据权利要求1所述的方法,其中所述第一硬件部件是具有多个处理器的服务器中的处理器。6.根据权利要求1所述的方法,还包括:在对所述第一硬件部件的所标识的固件更新已经被完成之后,所述向上扩展管理程序向所述第一硬件部件分配工作负荷。7.根据权利要求6所述的方法,还包括:标识可用于所述服务器复合体内的第二硬件部件的固件更新;所述向上扩展管理程序从所述第二硬件部件移除工作负荷;以及当所述第二硬件部件空闲并且所述管理程序继续运行所述单个操作系统和所述至少一个应用时,将所标识的固件更新应用到所述第二硬件部件。8.根据权利要求1所述的方法,还包括:所述操作系统将固件更新应用到所述第一服务器的所述第一硬件部件。9.根据权利要求8所述的方法,还包括:所述第一服务器上的平台管理模块将固件...

【专利技术属性】
技术研发人员:S·科查尔R·科尔维克J·伯尔肯哈根
申请(专利权)人:联想企业解决方案新加坡有限公司
类型:发明
国别省市:新加坡;SG

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1