【技术实现步骤摘要】
一种面向胖树互连网络的并行作业调度方法、系统及存储介质
本专利技术属于超级计算机系统中并行作业调度领域,具体而言,涉及一种面向胖树互连网络的并行作业调度方法、系统及存储介质。
技术介绍
在超级计算机系统中,用户向系统提交并行作业,在作业运行完毕后,获取运行结果。超级计算机的计算能力使得其可以为多个用户的多个并行作业同时提供服务。在超级计算机系统中,一般由资源管理系统完成对并行作业的调度,资源管理系统的任务主要包括两个:1)一个是对用户提交的作业进行排队,确定作业的优先级,即作业在系统中运行的顺序;2)另外一个是计算资源的分配,确定由那些计算资源,即计算节点来运行这个作业。现代超级计算机系统由大量计算节点通过高速互连网络连接而成。同一个并行作业的不同进程在不同的计算节点上运行,进程之间的数据交换通过结点上的高速互连网络接口进行。为了降低通信延迟、提升整体通信带宽,高速互连网络采用不同的网络拓扑结构。比较常用的网络拓扑结构包括无线网格网络Mesh、torus拓扑结构、胖树互连网络等。胖树互连网络拓扑结构中,若干计算节点连接到一个路由芯片上,同时若干个路由芯片连接到上一层路由芯片。这样,多个层次的路由芯片构成一个完整的胖树互连网络。在整个胖树互连网络中,路由芯片的层数,称为网络树的高度,叶结点路由芯片连接的计算节点数,称为网络树的宽度。图1示出了一个包括64个计算节点的胖树互连网络的拓扑结构,其中网络树的高度为3,网络的宽度为4。在该图中,圆形实心点表示计算节点,结点编号从0到63。方框表示路由芯片,每个路由芯片具有一个编号,其中编号的第一位表示该路由器在网络中 ...
【技术保护点】
1.一种面向胖树互连网络的并行作业调度方法,其特征在于:包括以下步骤1)调度开始后,从待分配计算资源的并行作业队列中获取待处理的并行作业序列{Job0,...,JobNjob‑1},并计算该并行作业序列中所有并行作业所需计算节点总数量Pjob,所述并行作业序列中共包含Njob个并行作业,所述Njob为预设自然数变量;2)判断当前空闲计算节点总数量Navail是否满足步骤1)所需计算节点总数量Pjob,满足则进入步骤3),不满足且上述Njob值为1,则等待下一次调度开始,否则降低此次调度中Njob的值,并返回步骤1);3)按顺序从
【技术特征摘要】
1.一种面向胖树互连网络的并行作业调度方法,其特征在于:包括以下步骤1)调度开始后,从待分配计算资源的并行作业队列中获取待处理的并行作业序列{Job0,...,JobNjob-1},并计算该并行作业序列中所有并行作业所需计算节点总数量Pjob,所述并行作业序列中共包含Njob个并行作业,所述Njob为预设自然数变量;2)判断当前空闲计算节点总数量Navail是否满足步骤1)所需计算节点总数量Pjob,满足则进入步骤3),不满足且上述Njob值为1,则等待下一次调度开始,否则降低此次调度中Njob的值,并返回步骤1);3)按顺序从个空闲最小调度单位中选取Ni个空闲计算节点分配给上述待处理的并行作业序列中的并行作业Jobi,直到所述并行作业序列中的所有并行作业完成计算节点分配,所述个空闲最小调度单位之间的两两跳步数之和最小,其中所述最小调度单位为连接到胖树互连网络中同一叶结点的Nunit个计算节点的集合,所述Nunit为预设自然数变量,所述Ni为并行作业Jobi所需计算节点数量,所述为为并行作业Jobi分配计算资源时所用到的空闲最小调度单位的数量。2.根据权利要求1所述的面向胖树互连网络的并行作业调度方法,其特征在于:所述步骤2)之后还包含对所述并行作业序列中的Njob个并行作业根据每个并行作业所需要的计算节点数量从多到少进行排序。3.根据权利要求1或2所述的面向胖树互连网络的并行作业调度方法,其特征在于:所述Njob缺省值为4。4.根据权利要求3中所述的面向胖树互连网络的并行作业调度方法,其特征在于:步骤2)的具体步骤包括:2.1)获取当前系统中空闲的最小调度单位数量Navail,计算当前系统中空闲的计算节点数量Nnode=Nunit×Navail;2.2)如果步骤1)中所述Pjob≤Nnode,进入步骤3),否则进入步骤2.3);2.3)如果Njob=1则此次并行作业调度完成,等待下一次调度开始,否则令Njob=Njob-1,返回步骤1)。5.根据权利要求1、2、4中任一项所述的面向胖树互连网络的并行作业调度方法,其特征在于:所述的最小调度单位包含的计算节点个数Nunit为:(1)如果系统节点总数小于等于4096:如果胖树互连网络叶结点所连接的计算节点数量Nleaf小于等于4,则Nunit=Nleaf;否则(2)如果系统节点总数大于4096:如果胖树...
【专利技术属性】
技术研发人员:董勇,陈娟,迟万庆,王睿伯,谢旻,周恩强,张伟,张文喆,李佳鑫,
申请(专利权)人:中国人民解放军国防科技大学,
类型:发明
国别省市:湖南,43
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。