一种面向多场景的可变深度资源管理方法及系统技术方案

技术编号:41432003 阅读:15 留言:0更新日期:2024-05-28 20:28
本发明专利技术公开了一种面向多场景的可变深度资源管理方法及系统,该方法包括:接收用户提交的高性能负载或高通量负载并判断负载类型;如果为高性能负载,通过常驻资源管理实例对高性能负载作业任务进行资源分配并控制执行高性能负载作业任务,常驻资源管理实例为固定深度;如果为高通量负载,由高通量负载管理器进行解析并拆分为多个子任务集合,在资源分配完成后,根据子任务集合数量启动临时资源管理父实例和子实例以控制执行作业任务,临时资源管理父实例、子实例、高通量负载管理器随高通量负载临时部署与销毁以实现可变深度。本发明专利技术根据系统负载类型动态改变资源管理系统的深度以适应高性能计算和高通量计算,从而能够同时为高性能计算和高通量计算提供稳定高效的资源管理。

【技术实现步骤摘要】

本专利技术主要涉及系统资源管理,具体涉及一种面向多场景的可变深度资源管理方法及系统


技术介绍

1、一台超级计算机由大量紧耦合的计算节点组成,各计算节点之间通过高速互连网络相互连接,为科学计算提供了极高的并行度。在此基础上,高性能计算(hpc)和高通量计算(htc)是超级计算机的两种主要计算模式。高性能计算是超级计算机的传统计算模式,主要针对于解决大规模科学计算和科学模拟问题,并广泛用于工程设计、天气预报、核物理研究等领域。单个高性能计算负载包含一至多个高性能计算任务。根据高性能计算的科学目的,同一个高性能计算负载中的多个高性能任务之间可能存在一定的依赖关系。每个高性能计算任务在超级计算机中映射为一个作业。单个高性能作业通常包含大量的计算进程,需要占用大量的计算和存储资源。高性能作业通常通过消息传递范式(mpi)将计算任务分配到多个计算进程上,利用超级计算机强大的计算和通信性能完成科学计算。随着超级计算机规模的增加,高性能计算的规模不断增加。高性能计算要求资源管理系统具备高可扩展性,并具备针对大规模并行作业的管理能力。因此,针对高性能计算负载,资源管理系统本文档来自技高网...

【技术保护点】

1.一种面向多场景的可变深度资源管理方法,其特征在于,步骤包括:

2.根据权利要求1所述的面向多场景的可变深度资源管理方法,其特征在于:

3.根据权利要求2所述的面向多场景的可变深度资源管理方法,其特征在于:

4.根据权利要求1所述的面向多场景的可变深度资源管理方法,其特征在于:

5.根据权利要求4所述的面向多场景的可变深度资源管理方法,其特征在于:

6.根据权利要求5所述的面向多场景的可变深度资源管理方法,其特征在于:所述临时资源管理父实例启动M个临时资源管理子实例,M为拆分的高通量子任务集合数量,每个临时资源管理子实例包含N...

【技术特征摘要】

1.一种面向多场景的可变深度资源管理方法,其特征在于,步骤包括:

2.根据权利要求1所述的面向多场景的可变深度资源管理方法,其特征在于:

3.根据权利要求2所述的面向多场景的可变深度资源管理方法,其特征在于:

4.根据权利要求1所述的面向多场景的可变深度资源管理方法,其特征在于:

5.根据权利要求4所述的面向多场景的可变深度资源管理方法,其特征在于:

6.根据权利要求5所述的面向多场景的可变深度资源管理方法,其特征在于:所述临时资源管理父实例启动m个临时资源管理子实例,m为拆分的高通量子任务集合数量,每个临时资源管理子实例包含n/m个代理进程以对应于n/...

【专利技术属性】
技术研发人员:戴屹钦王睿伯董勇卢凯张伟张文喆谢旻周恩强迟万庆李佳鑫邬会军吴振伟葛可适杨梨花
申请(专利权)人:中国人民解放军国防科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1