一种面向大规模并行机的快速作业调度方法技术

技术编号:32753008 阅读:33 留言:0更新日期:2022-03-23 18:48
本发明专利技术公开一种面向大规模并行机的快速作业调度方法,包括以下步骤:S1、设置系统作业等待时间阈值;S2、从作业池中获得所有待调度作业的基本信息;S3、将所有待调度作业按照计算得到的优先级由大到小进行排序;S4、各队列根据S3获得的作业排序情况,依次查询队列中可用资源数量是否满足待调度作业的资源需求,队列间可并行查询;S5、若队列中可用资源数量满足作业所需资源量,则调用作业启动模块启动该作业,并将启动结果记入数据库,此作业调度完成;S6、若队列中可用资源数量不满足作业所需资源量,则判断作业等待时间是否超过S1中设定的阈值。本发明专利技术解决了大规模并行机中固定资源规模需求作业的高效调度问题。规模需求作业的高效调度问题。规模需求作业的高效调度问题。

【技术实现步骤摘要】
一种面向大规模并行机的快速作业调度方法


[0001]本专利技术涉及一种面向大规模并行机的快速作业调度方法,属于高性能计算


技术介绍

[0002]作业调度器是作业管理系统的重要组成部分,其功能为在等待运行的作业中尽可能公平和高效地选择最合适的作业去调度运行,以满足用户课题实时运行需求,提高系统资源利用率。
[0003]目前常用的任务调度策略主要有传统改进算法、启发式算法和智能算法。传统改进算法能满足大规模并行机用户的基本需求,但是存在某些大作业因长时间得不到调度而被“饿死”、系统资源利用率低等问题;启发式算法简单直观,但是存在初期求解速度慢、搜索时间长、过早收敛等问题;智能算法能够自主地学习如何针对给定的优化目标有效地调度系统中独立的批处理作业,但是算法复杂,目前基本没有应用于超大规模系统中。

技术实现思路

[0004]本专利技术的目的是提供一种面向大规模并行机的快速作业调度方法,解决大规模并行机中固定资源规模需求作业的高效调度问题。
[0005]为达到上述目的,本专利技术采用的技术方案是:提供一种面向大本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种面向大规模并行机的快速作业调度方法,其特征在于:基于一作业调度架构,所述作业调度架构包括:作业池,用于存放所有待调度作业的基本信息;调度策略模块,用于按照某种规则从作业池中选择合适的作业调度运行;作业启动模块,用于启动运行已完成调度即将运行的用户作业;所述作业调度方法包括以下步骤:S1、根据实际系统中用户作业的需求,设置系统作业等待时间阈值;S2、从作业池中获得所有待调度作业的基本信息,包括作业的提交队列、提交时间以及资源需求;S3、根据S2获得的待调度作业的基本信息,将所有待调度作业按照计算得到的优先级由大到小进行排序;S4、各队列根据S3获得的作业排序情况,依次查询队列中可用资源数量是否满足待调度作业的资源需求,队列间可并行查询;S5、若队列中可用资源数量满足作业所需资源量,则调用作业启动模块启动该作业,并将启动结果记入数据库,此作业调度完成;S6、若队列中可用资源数量不满足作业所需资源量,则判断作业等待时间是否超过S1中设定的阈值,若超过,则对该作业所需的资源进行预约,待资...

【专利技术属性】
技术研发人员:宋长明龚道永刁晓娜陈德训钱宇张宏宇李伟东
申请(专利权)人:无锡江南计算技术研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1