【技术实现步骤摘要】
一种提升计算子系统能效的资源分配方法、系统及介质
本专利技术涉及高性能计算集群的资源分配技术,具体涉及一种提升计算子系统能效的资源分配方法、系统及介质。
技术介绍
高性能计算系统的计算能力越来越受到功耗的影响。尽管高性能计算中心的能耗增长迅速,高性能计算用户仍然需要更高的性能来运行更大数据规模下的更加复杂的模型。因此,迫切需要找到满足功耗约束条件下提高高性能计算程序性能的方法。目前在这一研究领域,有多种方法提高高性能计算系统的能量有效性,例如设计新的计算机体系结构、基于软件对高性能计算程序进行合理的资源调度。基于软件的资源调度方法,通过仔细确定计算资源设置,如计算节点数和处理器频率等,在满足功耗约束的条件下提高程序的性能。基于软件的资源调度方法的一个优势是,由于不需要进行硬件修改,因此它可以很容易地部署在现有硬件上。目前,大多数高性能计算中心的资源分配策略目标是最大限度地提高系统利用率,即分配尽可能少的计算节点。这种策略并没有考虑访存受限型并行程序的最佳性能和分配计算节点数之间的关系,因为处理器利用率最大化可能会导致访存受限 ...
【技术保护点】
1.一种提升计算子系统能效的资源分配方法,其特征在于实施步骤包括:/n1)确定最优增加节点数目ΔN*、处理器频率f*以及功耗限制值P
【技术特征摘要】
1.一种提升计算子系统能效的资源分配方法,其特征在于实施步骤包括:
1)确定最优增加节点数目ΔN*、处理器频率f*以及功耗限制值Ptarget;
2)利用动态处理器频率调节工具,设置功耗限制值为Ptarget,并调度并行程序运行在N+ΔN*个计算节点上,且每一个计算节点的处理器频率的初始值为处理器频率f*,其中N为并行程序运行需要的最少计算节点数,缺省资源分配下每一个处理器核运行一个进程。
2.根据权利要求1所述的提升计算子系统能效的资源分配方法,其特征在于,步骤1)之前还包括计算最优增加节点数目ΔN*的步骤,详细步骤包括:利用总内存带宽计算第一增加节点数据区间[0,ΔNpref];利用功耗约束条件计算第二增加节点数据区间[0,ΔNpower];求第一增加节点数据区间[0,ΔNpref]、第二增加节点数据区间[0,ΔNpower]之间的交集,并选择所求交集区间中的最大值作为最优增加节点数目ΔN*。
3.根据权利要求2所述的提升计算子系统能效的资源分配方法,其特征在于,所述利用总内存带宽计算第一增加节点数据区间[0,ΔNpref]的详细步骤包括:
S1)获取记录的各个时刻t各个计算节点上的实际访存带宽b1(t),b2(t),...,bN(t),计算并行程序运行期间的单节点平均实际访存带宽b(t),且取b(t)的最大值作为该并行程序的实际访存带宽BN,其中bi(t)为第i个计算节点上的实际访存带宽值;
S2)计算实际访存带宽BN相对单个节点的物理内存带宽B的比值bound,并根据比值bound是否达到阈值α判断该并行程序是否访存受限,如果非访存受限,则跳转执行步骤S3);如果访存受限,则跳转执行步骤S4);
S3)判定不需要增加节点,设置ΔNpref的数量为0,使得得到的第一增加节点数据区间[0,ΔNpref]为[0,0],结束并返回;
S4)根据总内存带宽不变原则N·((bound/α)·BN)=(N+ΔNpref)·α·B求解得到所需增加的节点数目ΔNpref,得到第一增加节点数据区间[0,ΔNpref],结束并返回。
4.根据权利要求2所述的提升计算子系统能效的资源分配方法,其特征在于,所述利用功耗约束条件计算第二增加节点数据区间[0,ΔNpower]具体是指,求解满足下述功耗约束函数的最大节点数目ΔN,并将得到的节点数目ΔN作为所需增加的节点数目ΔNpower,得到第二增加节点数据区间[0,ΔNpower];
上式中,n为并行程序的进程数,缺省资源分配下每一个处理器核运行一个进程,Pcpu(fmax)为单个处理器核的最大频率fmax下对应的最大功耗,Pcpu(fmid)为单个处理器核运行在fmid下对应的处理器功耗,c为每个计算节点上所拥有的处理器核数目,为单个处理器...
【专利技术属性】
技术研发人员:陈娟,齐新新,董勇,袁远,吴菲豪,孙晓乐,欧祉辛,张云放,
申请(专利权)人:中国人民解放军国防科技大学,
类型:发明
国别省市:湖南;43
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。