面向混合负载的多基准驱动调参服务器能效调优方法及装置制造方法及图纸

技术编号:38824225 阅读:17 留言:0更新日期:2023-09-15 20:03
本发明专利技术公开了一种面向混合负载的多基准驱动调参的服务器能效调优方法及装置,方法包括离线模型训练和在线能效调优两个阶段;离线阶段,收集多个基准的运行时数据,建立多标签负载分类模型实现混合负载与多基准间的映射,同时为各基准构建性能预测模型、最大性能评估模型、能效预测模型;在线阶段,基于不同参数的特性实现双粒度的优化策略:利用模型识别混合负载的资源需求及服务器实时能效状态,执行有针对性的系统参数调优;同时,基于能效曲线和CPU利用率实现细粒度的频率调节,解决寻优延迟导致的调优滞后问题。本发明专利技术能够自适应地识别混合负载的资源需求,并选择特定参数组合值进行优化,从而提高服务器运行复杂混合负载时的能效表现。的能效表现。的能效表现。

【技术实现步骤摘要】
面向混合负载的多基准驱动调参服务器能效调优方法及装置


[0001]本专利技术涉及云数据中心服务器参数调优领域,特别涉及一种面向混合负载的多基准驱动调参服务器能效调优方法及装置。

技术介绍

[0002]随着人工智能、物联网、区块链等技术的发展,新兴业务不仅在资源数量上出现了更大的需求量,也对服务器资源的使用效率提出了更高的要求。为了满足日益复杂的业务需求,数据中心的服务器运维策略需要在保证云服务质量的同时尽可能地降低维护成本与能源开销,以提升数据中心的整体能效。作为主流的运维优化策略,参数调优被应用于硬件设计、应用优化、网络流控等多个领域。然而,服务器及应用的参数种类众多,不同参数具有不同的适用场景和取值范围,通过手动调节的方式往往难以获取最优的参数组合。因此,不少学者会针对不同的业务场景设计参数调优策略,对服务器的性能及功耗进行优化。
[0003]针对大数据应用场景,Malik M等人提出了一种结合的协同调度和参数调优的调优框架ECoST。该框架以离线建表的方式确定不同类型负载共存于同一结点时的能效表现以及最优参数组合。在线阶段,ECoST通过决策树执行大数据负载的协同调度决策,并利用查表、非线性神经网络等模型进行参数调优。实验表明,该方法最高能够提升4%的能效,但它仅针对HDF的三个参数进行调优,随着参数数量及范围的不断扩大,离线建表的时间将越来越长。为了避免离线模型训练引起的高额开销,Fekry A等人提出了一种名为SimTune的参数调优方法。SimTune利用自动编解码器神经网络完成工作负载的低维空间特征映射,并通过哈密顿距离衡量低维空间中负载间的相似性,然后使用多任务贝叶斯优化(BO)在相似的工作负载之间共享调优模型,在该模型基础上实行增量调优来加快参数搜索的收敛速度,减小每次调优流程中重新训练模型的算法开销。
[0004]除了大数据应用外,参数调优在高性能计算(HPC)场景下同样应用广泛。Robert S等人提出了一种结合元启发式说算法的在线调优流程,用于调节HPC系统中IO加速器参数,解决不同HPC负载场景中的IO瓶颈问题。该在线调优流程包括负载识别、历史记录对比、元启发式调优、应用调优结果记录四个模块。作者选用整体表现最优的遗传算法作为调优算法,对文件区域的大小、数据预取阈值、数据预取大小、IO读取历史有效次数等参数进行调节,在IO带宽敏感和IO延迟敏感的基准应用中均取得了不错的效果。但算法在调优时需要实时采集HPC应用的性能数值作为调优算法的反馈,无法保证用户的隐私安全。
[0005]数据库作为云服务的后端存储应用同样存在大量的可调节参数。徐江峰等人对面向分布式NoSQL数据库HBase提出了出一种基于集成学习的配置参数调优方法。其核心思想是不断收集用户在使用HBase时的组合配置以及相应的吞吐量和延迟,并使用随机森林集成学习算法建立性能预测模型,通过遗传算法进行参数搜索以达到寻优的目的。作者在Yahoo云服务基准上进行了相关调优实验,结果表明,该方法相比默认配置平均提升了41%的吞吐量,延迟降低11.3%。该算法通过建立模型解决了在线调优过程中频繁的参数更迭所导致的业务性能波动问题,具备更强的稳定性。
[0006]操作系统层面的参数对服务器的能效有着重要影响,它包含大量影响硬件性能、功耗以及与应用交互行为的配置参数,合理设置此类参数能够使服务器以最佳状态运行用户负载,提升服务器能效水平。为了解决搜索空间过于庞大导致的高优化开销,S
á
nchez等人针对NUMA策略与预取器设置对各种基准负载的性能影响展开了研究。作者使用了ANN、SVM等机器学习算法从13个最有效的参数组合中为不同类型的负载确定最优的NUMA策略及预取器设置,减小了寻优开销。相比使用NUMA局部优化以及打开所有预取器的情况,该方法能够实现平均1.68倍的性能提升。
[0007]虽然上述的调优算法对应用的性能均有着一定的提升,然而大部分算法都仅适用于特定的应用场景,缺乏一定的通用性。同时,应用及操作系统底层的可调节参数多,范围广,参数与参数,参数与目标之间都可能存在未知的依赖,给调优问题带来了极大的困难。部分算法假设调优目标值可以直接获取,并没有考虑指标采集对用户隐私的负面影响。调优过程中参数的频繁改动也会引起业务的性能波动。这些同样是服务器系统调优过程中需要考虑的问题。因此,数据中心的服务器管理侧仍缺乏一种通用性较强,体系完善的调优策略。

技术实现思路

[0008]本专利技术的主要目的在于克服现有技术的缺点与不足,提供一种面向混合负载的多基准驱动调参的服务器能效调优方法及装置,本专利技术在无需侵入用户应用程序的条件下,通过预测建模完成服务器混合负载的实时能效评估,并指导参数搜索算法找出较优的参数组合,完成混合负载场景下的服务器能效调优,能够有效提升服务器的整体能效水平。
[0009]为了达到上述目的,本专利技术采用以下技术方案:
[0010]第一方面,本专利技术提供了一种面向混合负载的多基准驱动调参服务器能效调优方法,包括离线模型训练阶段和在线能效调优阶段,所述离线模型训练阶段为在线能效调优阶段提供模型支持;
[0011]所述离线模型训练阶段具体包括下述步骤:
[0012]采集服务器运行各单一基准负载时的能效表现和性能计数器数值,得到的不同类别负载的运行数据并作为训练集;
[0013]建立多标签负载分类模型实现混合负载与多基准间的映射;
[0014]为各基准建立性能预测模型、最大性能评估模型和能效预测模型,使用训练集训练性能预测模型、最大性能评估模型、能效预测模型,针对不同类别负载的数据分别采用多种回归拟合算法训练出模型,并对预测精度最高的三个模型进行组合作为最终预测模型,取三个模型的预测均值作为结果;
[0015]所述在线能效调优阶段具体包括下述步骤:
[0016]后台持续运行基于能效曲线的快速DVFS方法完成细粒度的CPU频率调优;
[0017]使用负载分类模型和性能预测模型对服务器当前运行的负载进行分类获取相似度评分;
[0018]通过能效预测模型和相似度评分计算出服务器综合能效评分;
[0019]利用综合能效评分指导参数搜索算法的完成粗粒度的系统参数调优。
[0020]作为优选的技术方案,所述采集服务器运行单一基准负载时的能效表现和性能计
数器数值时,采用拉丁超立方采样生成参数组合,以10%为粒度分别将负载水平设置为10%~100%进行性能计数器与能效表现相关指标的采集。
[0021]作为优选的技术方案,所述负载分类模型的训练过程中,使用特征筛选算法获取CPU、内存、磁盘负载上最显著的特征,然后采用K最近邻算法记录每个基准负载的数据记录;所述负载分类模型的输入为性能计数器,输出为相似度评分;
[0022]所述性能预测模型的输入为性能计数器,输出为数值;所述最大性能评估模型的输入为CPU、内存、磁盘相关的系统可调节参数,输出为最大性能预测值;所述能效预测模型的输入为CPU、内存、磁盘相关本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.面向混合负载的多基准驱动调参服务器能效调优方法,其特征在于,包括离线模型训练阶段和在线能效调优阶段,所述离线模型训练阶段为在线能效调优阶段提供模型支持;所述离线模型训练阶段具体包括下述步骤:采集服务器运行各单一基准负载时的能效表现和性能计数器数值,得到的不同类别负载的运行数据并作为训练集;建立多标签负载分类模型实现混合负载与多基准间的映射;为各基准建立性能预测模型、最大性能评估模型和能效预测模型,使用训练集训练性能预测模型、最大性能评估模型、能效预测模型,针对不同类别负载的数据分别采用多种回归拟合算法训练出模型,并对预测精度最高的三个模型进行组合作为最终预测模型,取三个模型的预测均值作为结果;所述在线能效调优阶段具体包括下述步骤:后台持续运行基于能效曲线的快速DVFS方法完成细粒度的CPU频率调优;使用负载分类模型和性能预测模型对服务器当前运行的负载进行分类获取相似度评分;通过能效预测模型和相似度评分计算出服务器综合能效评分;利用综合能效评分指导参数搜索算法的完成粗粒度的系统参数调优。2.根据权利要求1所述、面向混合负载的多基准驱动调参服务器能效调优方法,其特征在于,所述采集服务器运行单一基准负载时的能效表现和性能计数器数值时,采用拉丁超立方采样生成参数组合,以10%为粒度分别将负载水平设置为10%~100%进行性能计数器与能效表现相关指标的采集。3.根据权利要求1所述、面向混合负载的多基准驱动调参服务器能效调优方法,其特征在于,所述负载分类模型的训练过程中,使用特征筛选算法获取CPU、内存、磁盘负载上最显著的特征,然后采用K最近邻算法记录每个基准负载的数据记录;所述负载分类模型的输入为性能计数器,输出为相似度评分;所述性能预测模型的输入为性能计数器,输出为数值;所述最大性能评估模型的输入为CPU、内存、磁盘相关的系统可调节参数,输出为最大性能预测值;所述能效预测模型的输入为CPU、内存、磁盘相关的系统可调节参数以及估算性能值,输出为能效预测值;估算性能值为性能预测值与最大性能预测值中的更小者。4.根据权利要求1所述、面向混合负载的多基准驱动调参服务器能效调优方法,其特征在于,所述后台持续运行基于能效曲线的快速DVFS方法完成细粒度的CPU频率调优,具体为:基于不同基准负载的能效曲线确定每个CPU频率的最优能效利用率区间(U
lower
,U
upper
);根据当前逻辑核的利用率U
cur
依次调节每个CPU逻辑核的频率:若低于最优能效利用率下界U
lower
则降低频率,若U
cur
∈(U
lower
,U
upper
)则频率不变,若高于最优能效利用率上界U
upper
则升高频率,若U
cur
达到最大值则大幅提升频率。5.根据权利要求1所述、面向混合负载的多基准驱动调参服务器能效调优方法,其特征在于,所述使用负载分类模型和性能预测模型对服务器当前运行的负载进行分类获取相似度评分的步骤具体为:
读取离线训练好的K最近邻模型;利用K最近邻模型计算出当前负载数据点与不同基准的距离;选出CPU、内存、磁盘三个类别中距离当前负载数据点最接近的基准负载;将所选的三个基准负载与当前负载数据点的距离进行线性转换得到权重向量w={w
cpu
,w
mem
,w
io
},其中w
cpu
,w
mem
,w
io
分别为计算密集型、内存密集型、IO密集型权重;使用相应基准负载的性能预测模型获取性能预测值作为负载偏好度向量p={p
cpu
,p

【专利技术属性】
技术研发人员:林伟伟罗潇轩李俊祺
申请(专利权)人:华南理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1