【技术实现步骤摘要】
本专利技术涉及算力管理和智能调度领域,具体涉及一种基于全局规划的异构算力统一调度方法和系统。
技术介绍
1、随着aigc和数字智能的不断发展,计算需求和算力规模日益增加,传统的cpu算力已不能适配和满足大多算力应用场景。此时,各大硬件厂商纷纷推出各种异构算力设备,如gpu、npu、fpga等,以满足不同场景的用户使用。各种异构算力被逐渐用于普通模型和大模型的训练、微调、推理等多样化场景,根据对资源的使用方式不同,又可将算力资源分为资源隔离和资源共享两种使用方式,其中资源隔离包括整卡隔离和部分隔离,资源共享指整卡共享。
2、现有技术中,异构算力设备的管理和调度面临诸多挑战。首先,异构算力设备种类繁多,性能参数各异,导致对其进行统一管理和调度变得极为复杂。其次,多租户环境中,差异化的算力需求需要确保每个租户都能获得所需的算力资源,同时还要保证系统的整体稳定性和资源的高效利用。然而,现有的调度方法往往不能兼顾不同类型算力设备的高效利用,导致资源利用率低下,甚至出现资源浪费的情况。此外,现有技术在处理算力需求的实时变化和资源分配时,
...【技术保护点】
1.一种基于全局规划的异构算力统一调度方法,其特征在于,包括:
2.根据权利要求1所述的一种基于全局规划的异构算力统一调度方法,其特征在于,步骤1包括:
3.根据权利要求1所述的一种基于全局规划的异构算力统一调度方法,其特征在于,步骤3包括:
4.根据权利要求1所述的一种基于全局规划的异构算力统一调度方法,其特征在于,步骤5包括:
5.根据权利要求1所述的一种基于全局规划的异构算力统一调度方法,其特征在于,步骤7包括:
6.一种基于全局规划的异构算力统一调度系统,适用于上述权利要求1-5任一项所述的一种基于全
...【技术特征摘要】
1.一种基于全局规划的异构算力统一调度方法,其特征在于,包括:
2.根据权利要求1所述的一种基于全局规划的异构算力统一调度方法,其特征在于,步骤1包括:
3.根据权利要求1所述的一种基于全局规划的异构算力统一调度方法,其特征在于,步骤3包括:
4.根据权利要求1所述的一种基于全局规划的异构算力统一调度方法,其特征在于,步骤5包括:
5.根据权利要求1所述的一种基于全局规划的异构算力统一调度方法,其特征在于,步骤7包括:
6.一种基于全局规划的异构算力统一调度系统,适用于上述权利要求1-5任一项所述的一种基于全局规划的...
【专利技术属性】
技术研发人员:鲍钟峻,王玉木,窦鹏伟,姜志华,
申请(专利权)人:浩鲸云计算科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。