一种基于全局规划的异构算力统一调度方法和系统技术方案

技术编号:43002025 阅读:47 留言:0更新日期:2024-10-15 13:29
本发明专利技术提出一种基于全局规划的异构算力统一调度方法和系统,包括获取异构算力设备信息;建立全局算力规划模型;动态监控和识别设备状态;应用状态跟踪和资源调度;优化节点和设备选择;挂载设备文件和驱动目录;多维度算力使用监控;算力使用合理性评估和异常处理。本发明专利技术通过前瞻系统性的全局算力规划设计,构建敏捷严密的异构算力统一调度过程,实现多种异构算力的智能感知和精准调度,加之提供多维度的异构算力资源监控能力,有力支撑算力使用合理性的准确评估,更好满足复杂多变的算力应用场景,有效牵引异构算力利用率和生产力双提升。

【技术实现步骤摘要】

本专利技术涉及算力管理和智能调度领域,具体涉及一种基于全局规划的异构算力统一调度方法和系统


技术介绍

1、随着aigc和数字智能的不断发展,计算需求和算力规模日益增加,传统的cpu算力已不能适配和满足大多算力应用场景。此时,各大硬件厂商纷纷推出各种异构算力设备,如gpu、npu、fpga等,以满足不同场景的用户使用。各种异构算力被逐渐用于普通模型和大模型的训练、微调、推理等多样化场景,根据对资源的使用方式不同,又可将算力资源分为资源隔离和资源共享两种使用方式,其中资源隔离包括整卡隔离和部分隔离,资源共享指整卡共享。

2、现有技术中,异构算力设备的管理和调度面临诸多挑战。首先,异构算力设备种类繁多,性能参数各异,导致对其进行统一管理和调度变得极为复杂。其次,多租户环境中,差异化的算力需求需要确保每个租户都能获得所需的算力资源,同时还要保证系统的整体稳定性和资源的高效利用。然而,现有的调度方法往往不能兼顾不同类型算力设备的高效利用,导致资源利用率低下,甚至出现资源浪费的情况。此外,现有技术在处理算力需求的实时变化和资源分配时,缺乏灵活性和智能化手本文档来自技高网...

【技术保护点】

1.一种基于全局规划的异构算力统一调度方法,其特征在于,包括:

2.根据权利要求1所述的一种基于全局规划的异构算力统一调度方法,其特征在于,步骤1包括:

3.根据权利要求1所述的一种基于全局规划的异构算力统一调度方法,其特征在于,步骤3包括:

4.根据权利要求1所述的一种基于全局规划的异构算力统一调度方法,其特征在于,步骤5包括:

5.根据权利要求1所述的一种基于全局规划的异构算力统一调度方法,其特征在于,步骤7包括:

6.一种基于全局规划的异构算力统一调度系统,适用于上述权利要求1-5任一项所述的一种基于全局规划的异构算力统一...

【技术特征摘要】

1.一种基于全局规划的异构算力统一调度方法,其特征在于,包括:

2.根据权利要求1所述的一种基于全局规划的异构算力统一调度方法,其特征在于,步骤1包括:

3.根据权利要求1所述的一种基于全局规划的异构算力统一调度方法,其特征在于,步骤3包括:

4.根据权利要求1所述的一种基于全局规划的异构算力统一调度方法,其特征在于,步骤5包括:

5.根据权利要求1所述的一种基于全局规划的异构算力统一调度方法,其特征在于,步骤7包括:

6.一种基于全局规划的异构算力统一调度系统,适用于上述权利要求1-5任一项所述的一种基于全局规划的...

【专利技术属性】
技术研发人员:鲍钟峻王玉木窦鹏伟姜志华
申请(专利权)人:浩鲸云计算科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1