一种GPU算力资源调度的方法和系统技术方案

技术编号:42086749 阅读:34 留言:0更新日期:2024-07-19 17:02
本发明专利技术涉及资源调度领域,公开了一种GPU算力资源调度的方法和系统,包括:先接收并存储不同用户提交的计算任务;再将计算任务输入到预先训练好的神经网络模型中,获取计算任务所需要的算力资源值以及计算优先级;实时监测每个GPU设备的负载状态、性能状态,并获取每个GPU设备的剩余算力资源值、性能系数以及调度模式;其次,通过第一分析单元将第一匹配系数与系统预设的第一匹配阈值相比较,根据分析结果初步确定待分配计算任务的GPU设备;再将第二分析单元获取的第二匹配系数与第二匹配阈值进行比较;最后,根据第二分析单元的比较结果确定最终待分配计算任务的GPU设备,并将计算任务分配至相应的GPU设备处。

【技术实现步骤摘要】

本专利技术涉及资源调度领域,具体涉及一种gpu算力资源调度的方法和系统。


技术介绍

1、gpu算力资源调度是指根据计算任务的特性和需求,以及gpu资源的供应情况,进行高效、合理的分配和调度。它是提高计算资源利用效率、保证计算任务正常运行的关键环节。

2、在gpu算力资源调度中,任务调度是核心环节。调度器需要了解每个任务的特性,包括任务类型、优先级、数据大小、计算量等,然后基于这些信息,采用合适的调度算法进行任务调度。例如,优先级高的任务可以优先使用gpu资源,而优先级低的任务则等待或被分配到其他资源。

3、现有的gpu算力资源调度过程中存在共享调度和独占调度,在独占调度的过程中,gpu算力资源在任何时候都只能由一个任务独占,虽然避免了资源竞争,但是在该任务未满载的情况下,显然存在资源浪费;而在共享调度的过程,多个任务可以同时占用一个gpu算力资源,由此会引发资源竞争和效率下降;因此,如何保持计算效率和算力资源浪费的平衡,并据此根据计算任务提高匹配gpu设备的准确率还存在一定的问题。


术实现思路<本文档来自技高网...

【技术保护点】

1.一种GPU算力资源调度系统,其特征在于,包括:

2.根据权利要求1所述的GPU算力资源调度系统,其特征在于,第一分析单元的工作过程为:

3.根据权利要求2所述的GPU算力资源调度系统,其特征在于,所述GPU设备的负载系数:

4.根据权利要求3所述的GPU算力资源调度系统,其特征在于,所述GPU设备的性能系数:

5.根据权利要求4所述的GPU算力资源调度系统,其特征在于,获取所述第二匹配系数的过程为:

6.根据权利要求1或5所述的GPU算力资源调度系统,其特征在于,所述任务调度模块的工作过程为:

>7.根据权利要求5...

【技术特征摘要】

1.一种gpu算力资源调度系统,其特征在于,包括:

2.根据权利要求1所述的gpu算力资源调度系统,其特征在于,第一分析单元的工作过程为:

3.根据权利要求2所述的gpu算力资源调度系统,其特征在于,所述gpu设备的负载系数:

4.根据权利要求3所述的gpu算力资源调度系统,其特征在于,所述gpu设备的性能系数:

5.根据权利要求4所述的gpu算力资源调度系统,其特征在于,获取...

【专利技术属性】
技术研发人员:杨圳鑫杨圳漾杨小芳
申请(专利权)人:广东卧云信息技术有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1