AI服务器集群的算力调度方法及系统技术方案

技术编号:42720846 阅读:29 留言:0更新日期:2024-09-13 12:08
本发明专利技术涉及算力调度技术领域,揭露一种AI服务器集群的算力调度方法及系统,方法包括:选取AI服务器集群的算力分析指标,利用算力分析指标对AI服务器集群中的算力资源进行算力度量;计算用户方的待处理任务从用户方传输至算力资源的传输时延与传输能耗,计算算力资源处理待处理任务的处理时延与处理能耗,计算待处理任务调度算力资源的第一算力调度成本;计算算力资源调度协作算力资源的第二算力调度成本;构建待处理任务在算力调度状态与算力调度动作下的动作价值函数与状态价值函数;优化动作价值函数与状态价值函数,得到优化动作价值函数与优化状态价值函数。本发明专利技术可以增加对于算力资源的数据处理能力与协作处理能力的分析。

【技术实现步骤摘要】

本专利技术涉及算力调度,尤其涉及一种ai服务器集群的算力调度方法及系统。


技术介绍

1、ai服务器集群是指带有灵骏优化套件的高性能的异构加速计算节点的集合,算力调度是指将算力资源调度给用户,并为用户处理数据的过程。

2、目前,国内外关于ai服务器集群的算力调度方面已有广泛的研究,一般算力调度方式如下:分析用户任务量,评估算力资源的任务处理效率,构建算力资源处理用户的任务量的目标函数,通过求目标函数最小值来确定哪些算力资源处理用户的任务量的成本最低,从而确定最终需要调度的算力资源。

3、上述算力调度方式过程中,对算力资源的任务处理效率的评估是通过对算力资源的能耗的计算来实现的,也就是仅评估算力资源对任务处理的数量、时间等成本,但并未考虑算力资源是否有可以解决任务的资源,而非资源量,其次,目标函数中主要包含了算力资源的任务处理成本,在目标函数最小是所选取的算力资源受算力资源的任务处理效率的影响较大,对于算力资源的数据处理能力并未考虑,最后,在选择算力资源调度这个动作时,往往仅选择一个算力节点进行调度,并未考虑多个算力资源调度的问题。因此本文档来自技高网...

【技术保护点】

1.一种AI服务器集群的算力调度方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述选取AI服务器集群的算力分析指标,包括:

3.根据权利要求1所述的方法,其特征在于,所述利用所述算力分析指标对所述AI服务器集群中的算力资源进行算力度量,得到算力度量值,包括:

4.根据权利要求1所述的方法,其特征在于,所述计算用户方的待处理任务从所述用户方传输至所述算力资源的传输时延与传输能耗,包括:

5.根据权利要求1所述的方法,其特征在于,所述计算所述算力资源处理所述待处理任务的处理时延与处理能耗,包括:

6.根...

【技术特征摘要】

1.一种ai服务器集群的算力调度方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述选取ai服务器集群的算力分析指标,包括:

3.根据权利要求1所述的方法,其特征在于,所述利用所述算力分析指标对所述ai服务器集群中的算力资源进行算力度量,得到算力度量值,包括:

4.根据权利要求1所述的方法,其特征在于,所述计算用户方的待处理任务从所述用户方传输至所述算力资源的传输时延与传输能耗,包括:

5.根据权利要求1所述的方法,其特征在于,所述计算所述算力资源处理所述待处理任务的处理时延与处理能耗,包括:

6.根据...

【专利技术属性】
技术研发人员:邹煜琪费久保李红辉殷品高
申请(专利权)人:深圳华泓智能有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1