This paper presents a method of energy management for high-performance computing applications, based on the local principles of the program and the large number of iterations in high-performance computing applications. The running behavior of high performance computing operations is labeled by computing intensive and memory intensive, and the power consumption of the system components is adjusted according to the labeled tags, so as to achieve the purpose of energy management. The whole method is divided into monitoring step, identification step, adjustment step, prediction step and feedback step. Operation behavior monitoring steps responsible for monitoring the operation; identification steps operation behavior monitoring period by the current label; adjusting steps according to the adjustment rule labels corresponding to power state of the system components are adjusted; the steps of prediction to predict the operation behavior in the next stage; feedback step according to the operating condition after adjustment operation. Looking for the best adjustment rules of the current operation, to achieve the balance between performance and energy saving.
【技术实现步骤摘要】
一种针对存在大量迭代的高性能计算应用的能耗管理方法
本专利技术涉及设备能耗控制
,尤其涉及一种基于负载能耗管理系统方法,特指运行存在大量迭代的高性能计算应用时的能耗管理方法。
技术介绍
随着计算机的快速发展,面临的能耗问题越来越突出,在高性能计算中心昂贵的计算资源得不到充分的利用,却消耗了大量的电力资源。近几年提出的绿色计算概念越来越被人们重视。在Top500的综合评估中,从能耗-性能指标每秒每瓦百万指令数(MIPS/W)指标可以看出在评价一个计算系统的优劣时不仅考量计算机的性能也对计算系统的功耗进行评估。在高性能计算中心集群的实际使用过程中,资源的利用率比较低,可以利用硬件生产厂商提供的节能技术接口,动态的改变硬件的功耗状态,达到节能目的。在刀片服务器计算部分中包括CPU,硬盘,内存,网络部分。针对不同的硬件部分,硬件厂商提供了不同的节能技术,例如CPU可以通过DVFS(DynamicVoltageandFrequencyScaling)技术动态的调节CPU的频率,硬盘和内存有不同功耗状态,网卡通过调节不同的速率来达到节能目的。系统组件不同的功耗状态对应着不同的性能,组件功耗越低性能越低,导致时间开销就越大,因此需要同时考虑节能与性能两者因素,取得二者之间的平衡。过去的能耗研究大都集中在单个系统组件,而且需要对应用程序进行修改来实现。MajaEtinski等人基于DVFS技术提出了UPAS(UtilizationdrivenPower-AwareparalleljobScheduler)策略,周期性的计算第j周期CPU的利用率,基于第j周期CPU利 ...
【技术保护点】
一种针对存在大量迭代的高性能计算应用的能耗管理方法,其特征在于包括以下步骤:A)监控步骤:对高性能计算作业的运行行为进行监控;B)标识步骤:根据监控步骤获得的监控指标和知识库中的标签标识规则,对作业当前周期运行行为进行标签标识;C)调节步骤:当标识作业运行行为的标签发生变化时,根据标签对应的调节规则对系统组件的功耗状态进行调整;D)预测步骤:根据知识库中作业的行为序列和当前作业运行行为,来预测作业在下一阶段的运行行为;E)反馈步骤:根据调整后作业运行情况,优化标签对应的调节规则。
【技术特征摘要】
1.一种针对存在大量迭代的高性能计算应用的能耗管理方法,其特征在于包括以下步骤:A)监控步骤:对高性能计算作业的运行行为进行监控;B)标识步骤:根据监控步骤获得的监控指标和知识库中的标签标识规则,对作业当前周期运行行为进行标签标识;C)调节步骤:当标识作业运行行为的标签发生变化时,根据标签对应的调节规则对系统组件的功耗状态进行调整;D)预测步骤:根据知识库中作业的行为序列和当前作业运行行为,来预测作业在下一阶段的运行行为;E)反馈步骤:根据调整后作业运行情况,优化标签对应的调节规则。2.根据权利要求1所述的一种针对存在大量迭代的高性能计算应用的能耗管理方法,其特征在于,作业在运行过程中,每个监控周期作业的运行行为用相应的标签标识,连续被相同标签标识的周期被合并成一个阶段,即一个阶段包括一个或多个监控周期。3.根据权利要求1所述的一种针对存在大量迭代的高性能计算应用的能耗管理方法,其特征在于,在该方法中标签包括计算密集型,内存密集型,I/O密集型,网络密集型,混合型,全高型,空闲型。4.根据权利要求1所述的一种针对存在大量迭代的高性能计算应用能耗管理方法,其特征在于,系统组件包括CPU,内存,硬盘,网卡,这四部分是整个节点能耗消耗的主要部分,而且硬件厂商也提供了相应的功耗管理接口,当组件利用率比较低时,通过调节各个系统组件的功耗状态达到节能目的。5.根据权利要求1所述的一种针对存在大量迭代的高性能计算应用能耗管理方法,其特征在于,该方法包括一个知识库,知识库具有三个部分:5.1)标识规则:包含组件利用状态度量表和标签标识规则表,组件利用状态度量表记录系统组件名,对应组件的评价指标,该指标的最大值、最小值,以及标识组件使用状态的区间上限值、下限值,标签标识表记录每个标签对应组件的使用状态,评价指标包括CPI,CPU利用率,cache-references,cache-misses,硬盘的读写速率,网速的发送/接收速率;5.2)行为序列:保存作业在运行过程中标识作业运行行为的标签阶段序列,每个标签阶段包括标签名,处于当前标签阶段的周期数,以及该阶段各监控指标的平均值和能耗-性能指标值;5.3)调节规则:存储标签对应系统组件的功耗状态,包括标签名称,CPU功耗状态,内存功耗状态,硬盘功耗状态,网卡功耗状态。6.根据权利要求1所述的一种针对存在大量迭代的高性能计算应用能耗管理方法,其特征在于,所述监控步骤A首先判断当前周期是否处于监控周期,如果是则利用工具采集监控指标,否则进入下一周期的判断。7.根据权利要求1所述的一种针对存在大量迭代的高性能计算应用能耗管理方法,其特征在于,所述标识步骤B包括以下步骤:B.1将得到的监控指标标准化,标准化公式为:θmetric为对应指标标准化值,c为当前周期得到的监控指标值,β为该指标的最大值,α为该指标的最小值,然后计算组件所对应的多个评价指标的标准化值θmetric的平均值,即组件的利用率;B.2通过比较μ值与相应状态区间[low,high]得到组件使用状态,比较方法如下:μ≤low即当前组件处于空闲状态,low<μ≤high即当前组件处于中间状...
【专利技术属性】
技术研发人员:王云岚,谷建华,赵天海,王涛,侯正雄,李秀春,李露,张妍,胡雨桐,
申请(专利权)人:浪潮电子信息产业股份有限公司,西北工业大学,王云岚,
类型:发明
国别省市:山东,37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。