一种基于混合加速卡进行任务训练的方法及系统技术方案

技术编号:34191605 阅读:38 留言:0更新日期:2022-07-17 15:34
本申请公开了一种基于混合加速卡进行任务训练的方法及系统,该方法包括:通过AI平台识别当前集群中的所有加速卡,读取所有加速卡的关键信息,对所有加速卡的内存进行复用拆分预设,生成对应类型的加速小卡;利用加速小卡搭建混合加速卡资源库;根据当前的训练任务,从混合加速卡资源库中调用相应类型和内存大小的加速小卡;利用加速小卡执行训练任务。该系统包括:识别模块、拆分模块、混合加速卡搭建模块、调用模块和任务执行模块。通过本申请,能够打破不同产品不同加速卡类型之间的壁垒,实现资源的拆分重组,将资源进行更精准的分配,从而提高加速卡的使用率,提高资源利用率。提高资源利用率。提高资源利用率。

A method and system of task training based on hybrid accelerator

【技术实现步骤摘要】
一种基于混合加速卡进行任务训练的方法及系统


[0001]本申请涉及加速卡资源配置
,特别是涉及一种基于混合加速卡进行任务训练的方法及系统。

技术介绍

[0002]随着AI技术的发展,用户对于加速卡的需求越来越多,且对于加速卡的性能要求越来越高。为确保加速卡的性能,在同一个集群中,如何针对不同的加速卡进行任务训练,是个重要的技术问题。
[0003]目前针对不同的加速卡进行任务训练的方法,通常是根据不同的加速卡类型,分别进行任务训练。具体地,在同一个集群中,根据加速卡所匹配的AI方向,将加速卡分类,主要包括图片类、音频类以及算法类,然后根据用户需求,将不同类的加速卡应用于不同的训练脚本中,从而实现不同加速卡的任务训练。
[0004]然而,目前针对不同的加速卡进行任务训练的方法中,对不同加速卡进行分类,不同类的加速卡只有在用户需要该AI研究方向时,才被启用进行任务训练,用户没有需求时,不执行任务训练,在整个集群中该加速卡处于空闲状态。因此,目前针对不同加速卡进行任务训练的方法,对于整个集群来说,加速卡的使用率较低,资源空闲状态较本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于混合加速卡进行任务训练的方法,其特征在于,所述方法包括:通过AI平台识别当前集群中的所有加速卡,读取所有加速卡的关键信息,所述关键信息包括:加速卡的内存、类型以及所属节点;根据所述关键信息,对所有加速卡的内存进行复用拆分预设,生成对应类型的加速小卡;利用所述加速小卡,搭建混合加速卡资源库;根据当前的训练任务,从所述混合加速卡资源库中调用相应类型和内存大小的加速小卡;利用所述加速小卡执行训练任务。2.根据权利要求1所述的一种基于混合加速卡进行任务训练的方法,其特征在于,利用所述加速小卡,搭建混合加速卡资源库的方法,具体为:采用页面预设配置的方式,根据加速小卡所属节点,利用不同类型和内存的加速小卡设置混合加速卡资源组。3.根据权利要求1所述的一种基于混合加速卡进行任务训练的方法,其特征在于,利用所述加速小卡,搭建混合加速卡资源库的方法,具体为:根据AI平台约定规则,建立调用指令与集群中任一节点上加速小卡之间的映射关系。4.根据权利要求2所述的一种基于混合加速卡进行任务训练的方法,其特征在于,所述根据当前的训练任务,从所述混合加速卡资源库中调用相应类型和内存的加速小卡,包括:根据当前的训练任务,确定训练脚本所需要的加速卡的类型和内存;根据所述需要的加速卡的类型和内存,确定所需加速小卡的所属节点、类型和数量;根据所述加速小卡的所属节点、类型和数量,从所述混合加速卡资源组中调用相应的加速小卡。5.根据权利要求3所述的一种基于混合加速卡进行任务训练的方法,其特征在于,所述根据当前的训练任务,从所述混合加速卡资源库中调用相应类型和内存的加速小卡...

【专利技术属性】
技术研发人员:李琪龙
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1