【技术实现步骤摘要】
本专利技术涉及一种高性能计算集群的调度管理方法,具体涉及一种集群计算资源的分区调度管理方法。
技术介绍
随着高性能计算集群在各高新领域的广泛应用,集群上的应用呈现出处理过程复杂、应用种类多样的态势,不同类型的应用,或同一应用使用不同的运行方式都可能对计算资源有着不同的要求,因此如何通过作业调度系统,对计算资源进行合理分配,使作业能够被调度到对应的分区上,并做到对分区以及分区与队列关系的动态调整变成为了具有重要应用价值的问题。Torque 5. O中提供的针对队列的资源配置方法中,通过将单个计算节点与作业队列进行关联,来为队列中的作业分配可使用的计算资源。节点与队列的关联的具体方式为,·修改关联队列的acl_h0sts属性值为对应的节点名称。修改后,提交到该队列中的作业将会使用并且只能使用acl_h0sts属性中所指定的节点资源。现有技术存在以下问题Torque中所提供的这种节点资源配置方式基本可以解决不同类型作业对于计算资源的不同需求的问题。但是由于配置方式单一,导致易用性较差,尤其在集群规模较大、节点或队列数目较多、资源配置策略复杂等情况下,使用该方法实现队列与资源对 ...
【技术保护点】
一种集群计算资源的分区调度管理方法,其特征在于,所述方法包括下述步骤:(1)作业被提交到调度资源管理系统;(2)指定运行的作业队列;(3)判断作业队列所对应分区的空闲程度及优先顺序,并选择至少一个的分区;(4)确定作业运行所需的至少一个计算节点;(5)将作业调度到选定的计算节点上。
【技术特征摘要】
1.一种集群计算资源的分区调度管理方法,其特征在于,所述方法包括下述步骤 (1)作业被提交到调度资源管理系统; (2)指定运行的作业队列; (3)判断作业队列所对应分区的空闲程度及优先顺序,并选择至少一个的分区; (4)确定作业运行所需的至少一个计算节点; (5)将作业调度到选定的计算节点上。2.如权利要求I所述的集群计算资源的分区调度管理方法,其特征在于,所述步骤(I)中,作业被提交到调度资源管理系统Torque资源管理器中。3.如权利要求I所述的集群计算资源的分区调度管理方法,其特征在于,所述步骤(2)中,通过Torque资源管理器指定运行的作业队列。4.如权利要求I所述的集群计算资源的分区调度管理方法,其特征在于,所述步骤(3)中,根据队列分区配置工具Qpar的配置调度系统判断作业队列所对应分区的空闲程度及优先顺序,并选择至少一个的分区。5.如权利要求4所述的集群计算资源的分区调度管理方法,其特征在于,所述队列分区配置工具Qpar是指用于配置、查看队列与队列分区表之间的对应关系;所述队列分区表中记录了队列与分区之间的对应信息。6.如权利要求5所述的集群计算资源的分区调度管理方法,其特征在于,所述队列分区配置工具Qpar包括以下命令 A、显示所有队列及各队列对应的分区; B、显示指定队列的分区; C、添加新的队列,添加的队列为默认设置; D、为指定队列添加分区; E、所述指定队列使用调度...
【专利技术属性】
技术研发人员:张磊,张涛,
申请(专利权)人:曙光信息产业北京有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。