一种服务器功耗管理方法及设备技术

技术编号:17441977 阅读:37 留言:0更新日期:2018-03-10 14:39
本方案涉及服务器的功耗管理,当服务器电源的电源模块发生故障,功耗管理设备接收电源发送的故障信息,根据故障信息迅速将电源模块正常工作时服务器的第一功耗降低第一数值至服务器第二功耗,其中,第一数值不低于所述电源模块故障时所述服务器功耗的降低值;同时功耗管理设备根据所述服务器的功耗封顶值调整所述服务器第二功耗。本方案一方面避免了服务器宕机,另一方面提高电源模块发生故障后电源的利用率。

【技术实现步骤摘要】
一种服务器功耗管理方法及设备
本专利技术涉及信息
,尤其涉及一种服务器功耗管理方法及设备。
技术介绍
服务器通常会配备具有多个电源模块的电源。采用功耗封顶技术能够使服务器运行时功耗保持在一个稳定的水平,提高电源的利用率。用户设置服务器整机功耗的封顶值,在服务器运行过程中周期性检测整机功耗,如果达到封顶值,采取服务器的中央处理器(CentralProcessingUnit,CPU)降频等措施,将服务器功耗控制在目标功耗5%误差范围内。然而,当服务器某电源模块发生故障,由于功耗封顶操作完成的时间远大于电源模块发生故障时能够维持的时间,从而导致电源所能提供的总功耗迅速下降至服务器当前运行功耗以下,导致服务器宕机。
技术实现思路
一方面,本实施例提供一种服务器功耗管理方法,其中,电源为该服务器供电,该电源包含电源模块,功耗管理设备与该电源及该服务器通信。该方法包括:该功耗管理设备接收该电源模块的故障信息,将该服务器第一功耗降低第一数值得到服务器第二功耗,其中,该第一功耗为该电源模块正常工作时该服务器的功耗值,该第一数值不低于该电源模块故障时该服务器功耗的降低值;该功耗管理设备根据该服务器的功耗封顶值调整该服务器第二功耗,其中,该服务器的功耗封顶值为该第一功耗与该服务器功耗的降低值的差值。将服务器的功耗降低第一数值的具体实现方式包括但不限于拉低CPU的Prochot和Memhot管脚、关闭部件时钟、短时切断风扇供电和触发部件低载或休眠模式等。电源模块故障后,功耗管理设备在保持时间之内将服务器的功耗拉低第一数值,低至电源模块故障后电源所能提供的最大功耗以下,保证服务器不会宕机。功耗封顶技术可以实现对服务器功耗的精确调整,功耗管理设备周期性地检测服务器的功耗,并计算其与服务器的功耗封顶值的差值。当该差值大于预设的误差值,电源控制设备调整服务器的功耗,并继续检测功耗、计算差值,直到该差值达到预设误差范围内。功耗的调整的具体实现方式主要是对大功率部件的运行状态调整,包括但不限于CPU的调频调压、CPU内核打开关闭、CPU的P/T-state、内存频率、内存的T-state、硬盘读写和休眠状态、高速外设互联标准(PeripheralComponentInterconnectexpress,PCIe)网卡的L0/L1管脚状态、图形处理器(GraphicsProcessingUnit,GPU)工作状态、风扇转速及其他可以对服务器功耗实现精准控制的方式。本方法一方面避免了服务器宕机,另一方面提高电源模块发生故障后电源的利用率。结合第一方面,在第一方面的第一种可能实现方式中,该服务器包括多个节点。该功耗管理设备将该服务器第一功耗降低第一数值得到服务器第二功耗,具体包括:该功耗管理设备得到每个节点功耗的降低值,该功耗管理设备根据每个节点功耗的降低值,将每个节点的功耗降低第二数值,其中,该多个节点的第二数值之和等于该第一数值。该功耗管理设备根据该服务器的功耗封顶值调整该服务器第二功耗,具体包括:该功耗管理设备得到每个节点的功耗封顶值,其中该多个节点的功耗封顶值之和为该服务器的功耗封顶值;该功耗管理设备根据每个节点的功耗封顶值调整每个节点的功耗。第二方面,本实施例提供一种功耗管理设备,其中,该功耗管理设备与电源及服务器通信,该电源为该服务器供电,该电源包含电源模块;该功耗管理设备包括功耗降低单元和功耗封顶单元。该功耗降低单元用于执行以下操作:接收该电源模块的故障信息,将该服务器第一功耗降低第一数值得到服务器第二功耗,其中,该第一功耗为该电源模块正常工作时该服务器的功耗值,所述第一数值不低于所述电源模块故障时所述服务器功耗的降低值。所述功耗封顶单元用于执行以下操作:根据所述服务器的功耗封顶值调整所述服务器第二功耗,其中,所述服务器的功耗封顶值为该第一功耗与该服务器功耗的降低值的差值。结合第二方面,在第二方面的第一种可能实现方式中,该功耗降低单元还用于:将该故障信息发送给该功耗封顶单元;该功耗封顶单元用于接收该电源模块的故障信息,具体包括:根据从该功耗降低单元接收到该故障信息。结合第二方面或第二方面的第一种实现方式,在第二方面的第二种可能实现方式中,该服务器包括多个节点,该功耗降低单元包括多个功耗降低子单元,该功耗封顶单元包括多个功耗封顶子单元,每个功耗降低子单元和功耗封顶子单元与一个该节点通信。每个该功耗降低子单元用于执行以下操作:接收该故障信息,得到每个节点功耗的降低值,将每个节点的功耗降低第二数值,其中,该多个节点的第二数值之和等于该第一数值。每个该功耗封顶子单元用于执行以下操作:根据该故障信息,得到每个节点的功耗封顶值,其中该多个节点的功耗封顶值之和为该服务器的功耗封顶值,根据每个节点的功耗封顶值调整每个节点的功耗。结合第二方面,在第二方面的第三种可能实现方式中,该功耗降低单元还包括功耗降低管理单元,该功耗封顶单元还包括功耗封顶管理单元。该功耗降低管理单元用于执行以下操作:接收该故障信息,并将该故障信息转发给各该功耗降低子单元和所述功耗封顶管理单元;各该功耗降低子单元接收该电源模块的故障信息,具体包括:接收该功耗降低管理单元转发的该故障信息。该功耗封顶管理单元用于执行以下操作:接收该故障信息,并将该故障信息转发给各该功耗封顶子单元。各该功耗封顶子单元根据该故障信息,具体包括,接收该功耗降低管理单元转发的该故障信息。第三方面,本实施例提供一种功耗管理设备,其中,该功耗管理设备与电源及服务器通信,该电源为该服务器供电,该电源包含电源模块;该功耗管理设备包括接口和处理器,该接口与该处理器通信,该接口用于接收该电源模块的故障信息。该处理器用于执行以下操作:根据该故障信息将该服务器第一功耗降低第一数值得到服务器第二功耗,其中,该第一功耗为该电源模块正常工作时该服务器的功耗值,该第一数值不低于该电源模块故障时该服务器功耗的降低值;根据该故障信息和该服务器的功耗封顶值调整该服务器第二功耗,其中,该服务器的功耗封顶值为该第一功耗与该服务器功耗的降低值的差值。结合第三方面,在第三方面的第一种可能实现方式中,该服务器包括多个节点。该处理器用于将该服务器第一功耗降低第一数值得到服务器第二功耗,具体包括:得到每个节点功耗的降低值;根据每个节点功耗的降低值,将每个节点的功耗降低第二数值,其中,该多个节点的第二数值之和等于该第一数值。该功耗管理设备根据该服务器的功耗封顶值调整该服务器第二功耗,具体包括:得到每个节点的功耗封顶值,其中该多个节点的功耗封顶值之和为该服务器的功耗封顶值;根据每个节点的功耗封顶值调整每个节点的功耗。第四方面,本实施例提供一种功耗管理设备,其中,该非易失性可读存储介质包含第一计算机指令用于接收电源模块的故障信息,将服务器第一功耗降低第一数值得到服务器第二功耗,其中,该服务器由电源供电,该电源包含该电源模块,功耗管理设备与该电源及该服务器通信,该第一功耗为该电源模块正常工作时该服务器的功耗值,该第一数值不低于该电源模块故障时该服务器功耗的降低值。该非易失性可读存储介质还包括第二指令用于根据该服务器的功耗封顶值调整该服务器第二功耗,其中,该服务器的功耗封顶值为该第一功耗与该服务器功耗的降低值的差值。结合第四方面,在第四方面的第本文档来自技高网...
一种服务器功耗管理方法及设备

【技术保护点】
一种服务器功耗管理方法,其特征在于,电源为所述服务器供电,所述电源包含电源模块,功耗管理设备与所述电源及所述服务器通信;所述方法包括:所述功耗管理设备接收所述电源模块的故障信息,将所述服务器第一功耗降低第一数值得到服务器第二功耗,其中,所述第一功耗为所述电源模块正常工作时所述服务器的功耗值,所述第一数值不低于所述电源模块故障时所述服务器功耗的降低值;所述功耗管理设备根据所述服务器的功耗封顶值调整所述服务器第二功耗,其中,所述服务器的功耗封顶值为所述第一功耗与所述服务器功耗的降低值的差值。

【技术特征摘要】
1.一种服务器功耗管理方法,其特征在于,电源为所述服务器供电,所述电源包含电源模块,功耗管理设备与所述电源及所述服务器通信;所述方法包括:所述功耗管理设备接收所述电源模块的故障信息,将所述服务器第一功耗降低第一数值得到服务器第二功耗,其中,所述第一功耗为所述电源模块正常工作时所述服务器的功耗值,所述第一数值不低于所述电源模块故障时所述服务器功耗的降低值;所述功耗管理设备根据所述服务器的功耗封顶值调整所述服务器第二功耗,其中,所述服务器的功耗封顶值为所述第一功耗与所述服务器功耗的降低值的差值。2.根据权利要求1所述的方法,其特征在于,所述服务器包括多个节点;所述功耗管理设备将所述服务器第一功耗降低第一数值得到服务器第二功耗,具体包括:所述功耗管理设备得到每个节点功耗的降低值;所述功耗管理设备根据所述每个节点功耗的降低值,将所述每个节点的功耗降低第二数值,其中,所述多个节点的第二数值之和等于所述第一数值;所述功耗管理设备根据所述服务器的功耗封顶值调整所述服务器第二功耗,具体包括:所述功耗管理设备得到每个节点的功耗封顶值,其中所述多个节点的功耗封顶值之和为所述服务器的功耗封顶值;所述功耗管理设备根据所述每个节点的功耗封顶值调整所述每个节点的功耗。3.一种功耗管理设备,其特征在于,所述功耗管理设备与电源及服务器通信,所述电源为所述服务器供电,所述电源包含电源模块;所述功耗管理设备包括功耗降低单元和功耗封顶单元;所述功耗降低单元用于执行以下操作:接收所述电源模块的故障信息,将所述服务器第一功耗降低第一数值得到服务器第二功耗,其中,所述第一功耗为所述电源模块正常工作时所述服务器的功耗值,所述第一数值不低于所述电源模块故障时所述服务器功耗的降低值;所述功耗封顶单元用于执行以下操作:根据所述服务器的功耗封顶值调整所述服务器第二功耗,其中,所述服务器的功耗封顶值为所述第一功耗与所述服务器功耗的降低值的差值。4.根据权利要求3中所述的功耗管理设备,其特征在于,所述功耗降低单元还用于:将所述故障信息发送给所述功耗封顶单元;所述功耗封顶单元用于接收所述电源模块的故障信息,具体包括:根据从所述功耗降低单元接收到所述故障信息。5.根据权利要求3或4中所述的功耗管理设备,其特征在于,所述服务器包括多个节点,所述功耗降低单元包括多个功耗降低子单元,所述功耗封顶单元包括多个功耗封顶子单元,每个功耗降低子单元和功耗封顶子单元与一个所述节点通信;每个所述功耗降低子单元用于执行以下操作:接收所述故障信息,得到每个节点功耗的降低值,将所述每个节点的功耗降低第二数值,其中,所述多个节点的第二数值之和等于所述第一数值;每个所述功耗封顶子单元用于执行以下操作:根据所述故障信息,得到每个节点的功耗封顶值,其中所述多个节点的功耗封顶值之和为所述服务器的功耗封顶值,根据所述每个节点的功耗封顶值调整所述每个节点的功耗。6.根据权利要求5中所述的功耗管理设备,其特征在于,所述功耗降低单元还包括功耗降低管理单元,所述功耗封顶单元还包括功耗封顶管理单元;所述功...

【专利技术属性】
技术研发人员:王江涛李志兵陶朗
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1