自动调整计算系统的方法、计算系统和计算机可读介质技术方案

技术编号:38825915 阅读:14 留言:0更新日期:2023-09-15 20:05
本公开涉及自动调整计算系统的方法、计算系统和计算机可读介质。该方法包括将计算系统的当前工作负载映射到至少一个桶中;测量表示计算系统的当前操作的当前操作度量;基于该当前操作度量,为至少一个桶中的每一个确定至少一个优化方案,其中,该至少一个优化方案至少包括具有最佳值的系统旋钮列表,该系统旋钮配置成调节计算设备的操作以满足至少一个预定目标度量;并且将列在至少一个确定的优化方案中的系统旋钮中的每一个设置成其相应值。中的系统旋钮中的每一个设置成其相应值。中的系统旋钮中的每一个设置成其相应值。

【技术实现步骤摘要】
自动调整计算系统的方法、计算系统和计算机可读介质
[0001]本申请是申请日为2017年2月22日、国际申请号为PCT/US2017/018844、申请号为201780012424.1、专利技术名称为“用于计算系统自动调整的方法”的专利技术专利申请的分案申请。


[0002]本公开总体涉及在数据中心管理一个和多个计算服务器的性能和能量效率。

技术介绍

[0003]数据中心的运营者探索了方法,以降低他们的数据中心的运营费用(opex)并改善它们的性能。数据中心通常包括设计成执行不同应用程序的许多服务器(在其他计算系统/应用程序中)。在大部分情况下,服务器设计成或调整至在很多不同类型的应用程序中表现良好。然而,维持每个可能应用程序的高服务器性能不能由目前的可用方案来进行。例如,目前用于服务器调整的最先进的方法不能动态适用于由服务器执行的两个不同应用程序,并且不能让其中的每个获得最高性能。
[0004]数据中心的管理计算系统中的另一个挑战是管理用于工作单元的能耗与性能之间的取舍关系。也就是说,调整服务器以获得更高性能通常会增加工作单元的能耗。
[0005]大部分数据中心运营费用的其中一个是服务器和冷却器消耗的大量能量。数据中心能量效率的重要度量是电能使用效率(PUE)评级。PUE评级将数据中心的总功耗与IT设备消耗的总电能进行比较。理想的PUE是1.0。当计算PUE时,在数据中心消耗电力的任何设备都考虑在内,例如照明、冷却等。2.0的PUE评级意味着,服务器每消耗一瓦特,数据中心的基础设施消耗另一瓦特。因此,期望降低服务器的功耗,因为这种降低还会降低数据中心的基础设施的功耗。
[0006]已提出若干解决方案以降低数据中心的功耗。某些解决方案涉及数据中心的基础设施,而其他的解决方案处理数据中心的服务器或其他设备的硬件资源。
[0007]例如,低功率处理器可以是降低功耗的简单解决方案。但是,这种处理器造成性能限制,并因此可能不是理想的解决方案。存储控制器、适配器、磁盘驱动和其他硬件外围设备占用计算机服务器很大一部分的功耗,并且不容忽视。CPU和这些外围设备采用有助于降低功耗的电源管理装置。然而,每个外围设备是独立的电源管理并且没有相对于执行的应用程序和/或其他外围设备的运行而进行优化。
[0008]计算服务器通常包括各种硬件、固件和软件部件。在相关领域中探讨过的某些提议的解决方案包括将服务器部件的某些参数手动地调整至能量、性能或功率上限的基准组。然而,这种解决方案趋于造成高人工成本和次优结果。
[0009]进一步地,因为下列某些原因,服务器的手动调整是复杂的过程:参数的优化设置对不同应用程序可以是不同的;应用程序的参数优化设置可以在不同硬件配置之间改变;等等。此外,调整过程的复杂性由较高数量(通常在目前的系统中为100)的相互依赖的可调整参数引起。
[0010]由于所需的复杂性和时间,专家(如果有的话)仅在应用程序、参数或硬件配置的子集进行手动调整,从而实现性能的次优化。进一步地,调整需要在持续的基础上进行,从而产生额外的人工成本。
[0011]手动调整仅可以实现次优的优化,因为这样的调整不响应当前服务器的工作负载。也就是,当前工作负载可以不同于基准值,并且工作负载本身可以展示执行的不同阶段,而对每个阶段,该执行需要不同的参数值组。
[0012]总之,针对上述问题的现有解决方案不能适应正在进行的一个或多个应用程序、进程和任务的动态变化。
[0013]因此,提供克服上述缺陷的解决方案是有利的。

技术实现思路

[0014]以下是本公开的若干示例性实施例的概述。为了方便读者,提供本
技术实现思路
是为了提供对这些实施例的基本理解,并不完全限定本公开的广度。本
技术实现思路
不是所有考虑到的实施例的广泛概述,并且既不旨在确定所有实施例的关键(key or critical)要素,也不旨在描绘任何或所有方面的范围。其唯一的目的是将一个或多个实施例以简化的形式呈现出某些概念,作为稍后呈现的更详细描述的前奏。为了方便,可以在本文使用术语“某些实施例”以指代本公开的单个实施例或多个实施例。
[0015]本文公开的某些实施例包括用于自动调整计算系统的方法。该方法包括将计算系统的当前工作负载映射到至少一个桶中;测量表示计算系统的当前操作的当前操作度量;基于当前操作度量,为至少一个桶中的每一个确定至少一个优化方案,其中,该至少一个优化方案至少包括具有最优值的系统旋钮列表,该系统旋钮配置成调节计算设备的操作以满足至少一个预定目标度量;并将列在至少一个确定优化方案中的系统旋钮中的每一个设置成其相应值。
[0016]本文公开的某些实施例还包括计算系统,包括:处理电路;和存储器,该存储器包含指令,当由处理电路执行时,计算系统配置为:将计算系统的当前工作负载映射在至少一个桶中;测量表示计算系统的当前操作的当前操作度量;基于当前操作度量,为至少一个桶中的每一个确定至少一个优化方案,其中,该至少一个优化方案至少包括具有最优值的系统旋钮列表,该系统旋钮配置成调节计算设备的操作以满足至少一个预定目标度量;并将列在至少一个确定优化方案中的系统旋钮中的每一个设置成其相应值。
附图说明
[0017]在说明书结尾处的权利要求中特别指出并清楚地要求保护本文所公开的主题。通过以下结合附图的详细描述,公开实施例的上述和其他目的、特征和优势将显而易见。
[0018]图1是示出用于描述公开的实施例的数据中心的简图。
[0019]图2是实施例调谐器的框图。
[0020]图3是示出根据实施例用于优化计算服务器的功耗和性能的方法的流程图。
[0021]图4是示出根据一个实施例用于建立新优化方案的方法的流程图。
[0022]图5是示出根据另一个实施例用于建立新优化方案的方法的流程图。
具体实施方式
[0023]重要的是要注意,本文公开的实施例只是本文创新性教导的许多有利应用的实例。通常,本申请说明书中所做的陈述并不一定限制任何各种要求保护的实施例。并且,某些陈述可以应用于某些创新性特征,而不适用于其他的。通常,除非另外指出,单数要素可以是复数,反之亦然,不失普遍性。在附图中,相同标记在若干视图之间表示相同的部件。
[0024]根据公开的实施例,公开了用于优化计算服务器的某些系统度量的技术。在实施例中,限定用于服务器有待实现的目标度量,例如,使用系统管理员软件或管理软件。目标度量至少限定优化属性,该优化属性可以包括但不限于性能、能量、功率上限、功率、网络带宽(例如网卡的带宽)或其任意组合。每个优化属性还可以设置优化目标或特定值。例如,该目标可以最大化服务器的性能,以在服务器的功率上限在250瓦时最大化性能,或最小化每个提交指令的能量。进一步地,各种优化属性可以按优先排序。在一个实施例中,通过持续测量在服务器上运行的工作负载和动态调整被测量的工作负载的系统旋钮来改善限定的目标度量。在另一实施例中,该限定目标度量通过静态调整来改善,其中系统旋钮调整至其在过去本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种方法,所述方法包括:将计算系统的当前工作负载映射到相关工作负载的第一桶;其中,被映射到所述第一桶的所述相关工作负载关于目标度量相似地表现,并且使用应用至多个工作负载相关值的基于位置的散列函数执行所述映射;测量表示所述计算系统的当前性能的当前操作度量;由处理器基于所述当前操作度量和所述目标度量确定用于所述第一桶的改进所述当前操作度量的第一方案,其中,所述第一方案包括多个系统配置参数,各个系统配置参数均包括对应的值,其中,所述第一方案还是基于由所述计算系统当前执行的应用程序的当前执行阶段确定的;以及在所述当前执行阶段期间将所述第一方案中列出的所述系统配置参数中的各个系统配置参数设置为其对应的值。2.根据权利要求1所述的方法,其中,使用机器学习确定所述第一方案。3.根据权利要求1所述的方法,所述方法还包括:基于所述计算系统的当前工作负载预测未来工作负载,其中,所述第一方案还是基于预测的未来工作负载确定的。4.根据权利要求1所述的方法,所述方法还包括:针对所述多个系统配置参数中的各个系统配置参数测试配置;以及基于对所述配置的测试,为所述多个系统配置参数中的各个系统配置参数选择对应的值。5.根据权利要求4所述的方法,其中,针对所述多个系统配置参数中的各个系统配置参数测试所述配置还包括:将所述多个系统配置参数的子集中的各个系统配置参数迭代地设置为临时值。6.根据权利要求5所述的方法,所述方法还包括:持续监控所述计算系统的操作;以及基于所述计算系统的操作的变化动态地调整所述多个系统配置参数。7.根据权利要求5所述的方法,其中,使用强化学习确定所述第一方案。8.根据权利要求1所述的方法,其中,还基于根据所述第一方案改变所述多个配置参数的值的成本和应用所述第一方案的估计效益确定所述第一方案。9.根据权利要求1所述的方法,其中,所述当前操作度量是所述计算系统的当前工作负载,其中,所述计算系统的所述当前工作负载包括至少一个应用程序。10.根据权利要求1所述的方法,其中,测量所述当前操作度量还包括:运行所述计算系统,其中,当所述计算系统已经运行预定时间间隔时,测量所述当前操作度量。11.根据权利要求1所述的方法,所述计算系统包括多个组件,其中,将所述第一方案中列出的各个所述配置参数设置为其对应的值导致所述多个组件的重新配置。12.一种非瞬态计算机可读介质,所述非瞬态计算机可...

【专利技术属性】
技术研发人员:T
申请(专利权)人:斯诺普西斯公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1