一种GPU资源管理方法、装置、设备、存储介质及产品制造方法及图纸

技术编号:43123500 阅读:18 留言:0更新日期:2024-10-26 10:02
本申请公开了一种GPU资源管理方法、装置、设备、存储介质及产品,方法包括:对集群内的NODE节点进行分类;对待执行算法进行测试,得到算法耗时;根据所述算法耗时将所述待执行算法部署在相应的NODE节点;当所述待执行算法在相应的NODE节点上执行时,根据所述待执行算法的GPU资源使用情况,对相应的NODE节点进行扩缩容操作。采用本申请实施例能够高效利用GPU资源,满足不同算法需求的任务执行,提高资源利用率。

【技术实现步骤摘要】

本申请涉及gpu资源管理,尤其涉及一种gpu资源管理方法、装置、设备、存储介质及产品。


技术介绍

1、近年来,人工智能快速发展,如何用最低的算力实现高性能机器学习、深度学习是该领域关注的难题。gpu(graphics processing unit,图形处理器)硬件是最大化算力利用的关键,但其资源昂贵且难充分利用。如何高效利用gpu资源,满足不同算法需求的任务执行,以提高资源利用率是当前待解决的问题。


技术实现思路

1、本申请提供一种gpu资源管理方法、装置、设备、存储介质及产品,能够高效利用gpu资源,满足不同算法需求的任务执行。

2、为实现上述目的,本申请实施例提供了一种gpu资源管理方法,包括:

3、对集群内的node节点进行分类;

4、对待执行算法进行测试,得到算法耗时;

5、根据所述算法耗时将所述待执行算法部署在相应的node节点;

6、当所述待执行算法在相应的node节点上执行时,根据所述待执行算法的gpu资源使用情况,对相应的node节本文档来自技高网...

【技术保护点】

1.一种GPU资源管理方法,其特征在于,包括:

2.如权利要求1所述的GPU资源管理方法,其特征在于,所述对集群内的NODE节点进行分类,包括:

3.如权利要求2所述的GPU资源管理方法,其特征在于,所述对待执行算法进行测试,得到算法耗时,包括:

4.如权利要求2所述的GPU资源管理方法,其特征在于,所述根据所述算法耗时将所述待执行算法部署在相应的NODE节点,包括:

5.如权利要求1所述的GPU资源管理方法,其特征在于,所述当所述待执行算法在相应的NODE节点上执行时,根据所述待执行算法的GPU资源使用情况,对相应的NODE节点进行扩缩容...

【技术特征摘要】

1.一种gpu资源管理方法,其特征在于,包括:

2.如权利要求1所述的gpu资源管理方法,其特征在于,所述对集群内的node节点进行分类,包括:

3.如权利要求2所述的gpu资源管理方法,其特征在于,所述对待执行算法进行测试,得到算法耗时,包括:

4.如权利要求2所述的gpu资源管理方法,其特征在于,所述根据所述算法耗时将所述待执行算法部署在相应的node节点,包括:

5.如权利要求1所述的gpu资源管理方法,其特征在于,所述当所述待执行算法在相应的node节点上执行时,根据所述待执行算法的gpu资源使用情况,对相应的node节点进行扩缩容操作,包括:

6.如权利要求5所述的gpu资源管理方法,其特征在于,所述根据所述比较结果,对所述...

【专利技术属性】
技术研发人员:谢子元刘春阳孔令军张海涛谢倩
申请(专利权)人:中移物联网有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1