用于管理多服务器系统的方法技术方案

技术编号:37597442 阅读:11 留言:0更新日期:2023-05-18 11:45
公开了一种用于管理包括第一服务器(12)及第二服务器(14、16)的多服务器系统(10)的工作量的方法,包括以下步骤:确定所述第一服务器的基准功耗特性;计算机软件(18)分配工作予所述第一服务器;所述计算机软件监视所述第一服务器运作时的功耗特性;所述计算机软件比较所述第一服务器的所述基准功耗特性和所述第一服务器运作时的功耗特性;以及取决于所述比较的结果,所述计算机软件减少或停止将工作分配予所述第一服务器、或从所述第一服务器转移至少部份工作予所述第二服务器。至少部份工作予所述第二服务器。至少部份工作予所述第二服务器。

【技术实现步骤摘要】
用于管理多服务器系统的方法


[0001]本专利技术涉及一种用于管理多服务器系统的方法,特别一种用于管理多服务器系统的工作量的方法,亦涉及一种多服务器系统。

技术介绍

[0002]服务器的功耗特性,例如其电源单元(PSU)将交流电转换成直流电的效率(简称“工作效率”),可用效率曲线代表。
[0003]大致而言,同一型号的PSU均具有相近的工作效率。若PSU在运作出现错误,会使其工作效率变差,因而出现运行时的工作效率曲线偏离基准工作效率曲线的情况。
[0004]PSU出现工作效率变差的情况,可能有各种理由。例如若有电容器短路,更多功率会以热的形式消耗,因此增加输入功率,但输出功率不会增加。另外一个可能性是积聚太多尘埃,使PSU不能在一个温度较低的环境中运作。
[0005]在安排分配工作予多个服务器时,大多不会考虑个别服务器的PSU的工作效率。然而,这可能引致以下的问题。
[0006]首先,PSU的工作效率变差(表现于该PSU运行时的工作效率曲线偏离基准工作效率曲线)会增加运作该PSU的功率消耗。其次,若允许PSU在并非最佳的状态继续运作,会减低数字信号的信噪比,因而引致间歇性的逻辑错误,例如蓝屏错误,或是因记忆内容细微的改变而引致程式运作出错等。另外,对外围设备(例如硬盘)提供不合适电压的电力,可能会引致可恢复的读取错误,令硬盘进行重试程序,因而拖慢硬盘的运行速度。
[0007]因此,本专利技术的一个目的是提供一种用于管理第一服务器及第二服务器的工作量的方法、以及一种多服务器系统,以期减轻上述现有技术的缺点,或者至少为行业和公众提供有用的替代方案。

技术实现思路

[0008]根据本专利技术的第一方面,提供一种用于管理第一服务器及第二服务器的工作量的方法,包括以下步骤:确定所述第一服务器的基准功耗特性;计算机软件分配工作予至少所述第一服务器;所述计算机软件监视至少所述第一服务器运作时的功耗特性;所述计算机软件比较所述第一服务器的所述基准功耗特性和所述第一服务器运作时的功耗特性;以及取决于所述比较的结果,所述计算机软件减少或停止将工作分配予所述第一服务器、或从所述第一服务器转移至少部份工作予所述第二服务器。
[0009]根据本专利技术的第二方面,提供一种多服务器系统,其中包括第一服务器及第二服务器,其中,所述第一服务器及所述第二服务器适于接受计算机软件所分配的工作;其中,至少所述第一服务器适于由所述计算机软件监视其运作时的功耗特性;以及其中,至少所述第一服务器适于被计算机软件减少或停止分配工作、或从其转移至少部份工作予所述第二服务器。
附图说明
[0010]现在将参考附图仅通过示例描述本专利技术的实施方式,其中:
[0011]图1是根据本专利技术实施方式的管理多服务器系统的工作量的方法的布置示意图;以及
[0012]图2示出了一个示例的PSU工作效率曲线图,显示PSU的基准工作效率曲线、以及该PSU在某段运作时段中的工作效率曲线。
具体实施方式
[0013]图1示出了根据本专利技术实施方式的管理多服务器系统10的工作量的方法的布置。多服务器系统10包括多台服务器12、14、16,每台服务器12、14、16有其各自的操作系统12a、14a、16a、服务处理器(尤其是基板管理控制器(BMC)12b、14b、16b)、以及电源单元(PSU)12c、14c、16c。
[0014]服务器12、14、16的操作系统12a、14a、16a和BMC 12b、14b、16b均与计算机软件18可数据互通地连接,从而允许计算机软件18确定各服务器12、14、16的功耗特性、监视各服务器12、14、16的PSU 12c、14c、16c运作时的功耗特性、以及管理分配予各服务器12、14、16的工作量。各服务器12、14、16的功耗特性可以是服务器12、14、16各自的PSU 12c、14c、16c将交流电转换成直流电的效率(简称“工作效率”)。
[0015]适合用于本专利技术的计算机软件可以是一种称为“编排器”(“Orchestrator”)的计算机软件,其主要是一种类工作量调度器,功能包括在一个多服务器系统的环境中管理、计划、监视、自动化和控制工作量的分配和调度。其中一个可以采用为编排器18的计算机软件是由The Linux Foundation所提供的Kube

scheduler。这是一个开源的容器编排引擎,用于容器化任务的自动化编排、部署、扩缩和管理,并且可以根据设定规则对工作量进行部署。
[0016]图2示出了服务器12的一个示例的PSU 12c的工作效率曲线图,其中曲线20为服务器12的PSU 12c的基准工作效率曲线。
[0017]可以通过在BMC 12b开机时间功率校准阶段量度,或是通过对服务器12的PSU 12c的输入功率和输出功率进行采样,由BMC 12b动态地产生服务器12的PSU 12c的基准工作效率曲线。同样,可以通过在BMC 14b、16b开机时间功率校准阶段量度,或是通过对服务器14、16的PSU 14c、16c各自的输入功率和输出功率进行采样,由BMC 14b、16b动态地产生服务器14、16各自的PSU 14c、16c各自的基准工作效率曲线。编排器18存储由BMC 12b、14b、16b所产生的服务器12、14、16各自的PSU 12c、14c、16c的基准工效率曲线,作为比较基准。
[0018]在服务器12、14、16运作时,编排器18监视各服务器12、14、16的PSU12c、14c、16c运作时的功耗特性(尤其是工作效率)。编排器18可以实时地、或间歇地(例如每隔一段预定时间)监视PSU 12c、14c、16c运作时的工作效率。图2中的曲线22是服务器12的PSU 12c在某段运作时段中的工作效率曲线。从图2可见,在该段运作时段中,服务器12的PSU 12c的工作效率比曲线20所表示的服务器12的PSU 12c的基准工作效率为差。例如,根据曲线20,当服务器12的PSU 12c的使用率是40%时,其基准工作效率是95%,但根据曲线22,当PSU 12c运作时的工作效率仅是大约92.5%。
[0019]编排器18不时将各服务器12、14、16的PSU 12c、14c、16c运作时的工作效率和其各
自的基准工作效率作比较,并且,取决于比较的结果,安排分配到各服务器12、14、16的工作量。
[0020]按照本专利技术的方法及系统的使用者可以透过编排器18预设其允许服务器12、14、16的PSU 12c、14c、16c运作时的工作效率和其各自的基准工作效率偏离的程度或数值,例如2.8%。这允许的偏离程度会基于PSU的硬件设计而有一个既定数值,亦会由编排器18基于用户的数据中心的环境(例如温度、湿度等)通过学习而自动调整。
[0021]以图2中的曲线20及22为例,假设编排器18在监视期间发现服务器12的PSU 12c的使用率是50%,而当时的运作工作效率是93%。编排器18将这运作时的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于管理第一服务器及第二服务器的工作量的方法,包括以下步骤:确定所述第一服务器的基准功耗特性;计算机软件分配工作予至少所述第一服务器;所述计算机软件监视至少所述第一服务器运作时的功耗特性;所述计算机软件比较所述第一服务器的所述基准功耗特性和所述第一服务器运作时的功耗特性;以及取决于所述比较的结果,所述计算机软件减少或停止将工作分配予所述第一服务器、或从所述第一服务器转移至少部份工作予所述第二服务器。2.根据权利要求1的方法,其中所述第一服务器包括服务处理器,以及其中所述服务处理器产生所述第一服务器的所述基准功耗特性。3.根据权利要求2的方法,其中所述服务处理器是基板管理控制器。4.根据权利要求1或2的方法,其中所述功耗特性至少包括所述第一服务器的电源单元的工作效率。5.根据权利要求1或2的方法,其中若所述比较的结果是所述第一服务器运作时的功耗特性比所述第一服务器的所述基准功耗特性低一个预设程度,所述计算机软件将从所述第一服务器转移至少部份工作予所述第二服务器、及/或停止将工作分配予所述第一服务器。6.根据权利要求1或2的方法,其中若所述比较的结果是所述第一服务器运作时的功耗特性比所述第一服务器的所述基准功耗特性低所述预设程度,所述计算机软件将发出相应输出。7.根...

【专利技术属性】
技术研发人员:张彩红陈江雷鸣杨少辉
申请(专利权)人:联想北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1