一种机群作业管理系统中低功耗的动态结点控制方法技术方案

技术编号:3959030 阅读:286 留言:0更新日期:2012-04-11 18:40
本发明专利技术一种机群作业管理系统中低功耗的动态结点控制方法,该方法有四大步骤:步骤一:对结点的状态进行划分;步骤二:设定时间阈值常量MAX_TIMESPAN,便于结点状态的调节;步骤三:根据机群系统的负载确定结点中每个状态所占比例,便于对计算结点进行分层管理;步骤四:根据作业量情况逐级动态调整各结点状态。本发明专利技术首先考虑作业的资源需求,根据机群系统中的作业量情况对计算结点的状态进行实时控制和分层次管理,以保证在系统性能不受影响的情况下降低系统的整体功耗。它在计算机群功耗技术领域内具有广泛地实用价值和应用前景。

【技术实现步骤摘要】

本专利技术涉及一种机群的动态结点控制方法,具体涉及,属于计算机群功耗

技术介绍
目前,在高性能计算领域,能耗问题越来越受到重视。如何降低机群系统的功耗是 当前高性能计算领域研究的热点。除了从硬件低功耗芯片等方面的考虑外,通过机群监控系统对结点状态进行控制 是常用的方法之一,即休眠或关闭部分结点来降低功耗。这种方式需要由管理员根据当前 系统负载确定休眠、唤醒或关闭多少结点以及对哪些结点进行以上操作。此方式对结点的 控制较主观,不能根据机群系统中作业的实际需求,对结点进行动态调整。有可能会在降低 系统功耗的同时,影响作业响应时间,使系统的吞吐率下降,从而降低系统的整体性能。如果在机群作业调度系统中根据作业量对计算结点进行动态控制,可以避免以上 静态调整带来的缺点,并且可以使机群系统性能不降低的情况下使系统的整体功耗下降, 在高性能计算机领域有很重要的意义。
技术实现思路
1、目的有鉴于此,本专利技术的目的是提供一种机群作业管理系统中低功耗的动态 结点控制方法,它首先考虑作业的资源需求,在满足需求的情况下对结点状态进行动态控 制,从而降低系统的整体功耗。2、技术方案为达到上述目的,本专利技术的技术方案是这样的如图1所示,本专利技术,该方 法包括以下步骤步骤101.对结点的状态进行划分;步骤102.设定时间阈值常量MAXJIMESPAN,便于结点状态的调节;步骤103.根据机群系统的负载确定结点中每个状态所占比例,便于对计算结点 进行分层管理;步骤104.根据作业量情况逐级动态调整各结点状态;其中,步骤101所述的结点状态可以划分为空闲(idle)、忙碌(busy)、休眠、关机 (down) 0其中的休眠我们采用ACPI规范中的S3和S4两种方式。S3是挂起到内存,简称 STR (Suspend to RAM),S4是挂起到硬盘,简称STD (Suspend to DISK)。即结点共包括5种 状态。本专利技术在硬件条件方面,要求机群系统中各结点同时支持挂起到内存(STR)和挂 起到硬盘(STD)这两种休眠方式。在软件条件方面,若操作系统采用的是Linux,要求其内 核版本在2. 6. 18以上,以避免低版本内核在电源管理方面的缺陷。其中,步骤102和103中所述的时间阈值常量和各状态比例可由管理员根据系统实际情况做相应的调整。时间阈值MAXjIMESPAN是调节结点状态时参考的时间戳,即当结 点在某一状态的时间达到阈值,则可以将其调整为下一状态。其中,步骤103所述的分层管理是指对系统中除忙碌状态以外的结点,其余结点 按设定比例控制处于空闲、休眠(包括STR和STD)、关机状态的结点数,这样可以保证系统 在任何时刻都有空闲、休眠、关机的结点,随时满足作业需求。其中,步骤104所述的作业量情况是指系统当前的负载大小。如果当前系统作业 队列为空,则按照各状态的结点比例,休眠或关闭部分空闲结点。反之,如果当前系统负载 较大,资源不足造成作业排队,则根据作业需求唤醒相应数量的休眠结点,并调整其他各结 点状态,使整个系统达到预先设定的比例。 休眠或关闭结点时,按照从空闲(idle)、STR休眠、STD休眠、关机的顺序进行逐级 调整,唤醒则从相反的方向。由于每种状态的特点不同,STR休眠状态唤醒时间短,但是节 能较少,STD休眠节能效果较好,但其唤醒时需要较长的时间,关机的节能最好,但远程开机 需要更长的时间。基于每种状态的上述特点,我们通过分层次的控制方式逐级进行调整,可 以避免作业骤然增多时,由于远程开机或唤醒时间过长造成作业响应时间加长,从而影响 系统性能。3、优点及功效本专利技术,它 与现有技术比,其主要优点是(1)不是简单地休眠或关闭部分结点,而是根据系统中作业 量情况动态调整结点状态,充分保证了系统中作业的资源需求;(2)对结点的状态进行分 层管理,在更新结点状态时采用逐级调整的方法,并且在任何时刻系统中都有处于各种状 态(空闲,休眠,关机)的计算结点,不会造成由于作业量骤增时批量唤醒结点而导致的系 统性能下降,达到了在不降低系统性能的前提下降低系统功耗的目的。附图说明图1低功耗结点状态控制流程示意2根据作业量控制结点状态的流程示意3系统负载小时结点状态转化4系统负载大时结点状态转化图具体实施例方式为使本专利技术的目的、技术方案和优点表达得更加清楚明白,下面结合附图及具体 实施例对本专利技术再作进一步详细的说明。本专利技术的主要思想是根据机群系统中的作业量情况对计算结点的状态进行实时 控制,并且对结点按各种状态分层次管理,以保证在系统性能不受影响的情况下降低系统 的整体功耗。硬件系统方面,机群结点均为联想深腾B714R刀片服务器,采用千兆以太网互联。 软件系统方面,结点操作系统为Red Hat Enterprise Linux,内核版本为2. 6. 30,机群作业 管理系统以开源软件Maui和OpenPBS为基础开发。首先在系统中设定时间阈值MAX_TIMESPAN,但并不是只按照此阈值改变结点状 态。为避免系统中系统负载骤然增加或减少导致计算结点状态频繁改变而影响硬件寿命,还要确定系统中除忙碌(busy)以外的四种状态(空闲、STR、STD、关机)结点数的比例。并 在系统运行过程中按照空闲、STR、STD、关机的优先顺序保证结点比例。下面以一实例进行说明,对各状态结点比例设定如下空闲状态结点占30%,STR 休眠状态结点占20 %,STD休眠状态结点占20 %,关机状态结点占30 %。如图2所示,包括 以下步骤步骤201 系统刚启动后,即在作业队列中没有作业的情况下,按照图3所示的结 点状态转化图更新结点状态。具体的结点更新过程如下判断各个计算结点处于每个状态的时间是否超过设定的时间阈值MAX_TIMESPAN。 若计算结点处于空闲状态(idle)的时间超过MAX_TIMESPAN,则将该结点状态从空闲 (idle)转变为STR休眠(Suspend to RAM),并在空闲结点数达到30%时停止更新;若计 算结点处于STR休眠(Suspend to RAM)状态的时间超过MAX_TIMESPAN,则将该结点状态 从STR休眠(Suspend to RAM)转变为STD休眠(Suspend to DISK),并在STR休眠结点数 达到20%时停止更新;同样若计算结点处于STD休眠(Suspend to DISK)状态的时间超过 MAX_TIMESPAN,则将该结点状态从STD休眠转变为关机(Down)状态,在STD休眠结点数达 到20%时停止更新。步骤202 在系统运行过程中,需按照系统中作业量的情况触发结点状态更新。当 作业队列中无作业,则可以休眠、关闭部分结点;反之,若队列中有作业处于排队,则按相反 的方向唤醒、开启结点。无论从哪个方向进行结点的更新,都要保证设定的各状态结点的比 例保持不变。根据队列情况的具体控制方法如下若队列中无作业,按照图3进行结点状态更新,并使系统中结点数达到预定比例 要求。若已经达到比例要求,则不进行调整。若队列中有作业,根据作业需求,判断资源是否满足需求。如果当前空闲结点不 能满足需求,则按照作业需求量唤醒相应数量的结点,并按照图4所示依次更新空闲、STR、 STD、关机各状态结点,使id本文档来自技高网...

【技术保护点】
一种机群作业管理系统中低功耗的动态结点控制方法,在硬件条件方面,要求机群系统中各结点同时支持挂起到内存即STR和挂起到硬盘即STD这两种休眠方式;在软件条件方面,操作系统采用的是Linux,要求其内核版本在2.6.18以上,以避免低版本内核在电源管理方面的缺陷;其特征在于:该方法具体步骤如下:步骤一:对结点的状态进行划分;步骤二:设定时间阈值常量MAX_TIMESPAN,便于结点状态的调节;步骤三:根据机群系统的负载确定结点中每个状态所占比例,便于对计算结点进行分层管理;步骤四:根据作业量情况逐级动态调整各结点状态。

【技术特征摘要】

【专利技术属性】
技术研发人员:肖利民梁爱华刘卓阮利雷松松
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1