【技术实现步骤摘要】
本申请涉及gpu资源管理,尤其涉及一种gpu资源管理方法、装置、设备、存储介质及产品。
技术介绍
1、近年来,人工智能快速发展,如何用最低的算力实现高性能机器学习、深度学习是该领域关注的难题。gpu(graphics processing unit,图形处理器)硬件是最大化算力利用的关键,但其资源昂贵且难充分利用。如何高效利用gpu资源,满足不同算法需求的任务执行,以提高资源利用率是当前待解决的问题。
技术实现思路
1、本申请提供一种gpu资源管理方法、装置、设备、存储介质及产品,能够高效利用gpu资源,满足不同算法需求的任务执行。
2、为实现上述目的,本申请实施例提供了一种gpu资源管理方法,包括:
3、对集群内的node节点进行分类;
4、对待执行算法进行测试,得到算法耗时;
5、根据所述算法耗时将所述待执行算法部署在相应的node节点;
6、当所述待执行算法在相应的node节点上执行时,根据所述待执行算法的gpu资源使用情况
...【技术保护点】
1.一种GPU资源管理方法,其特征在于,包括:
2.如权利要求1所述的GPU资源管理方法,其特征在于,所述对集群内的NODE节点进行分类,包括:
3.如权利要求2所述的GPU资源管理方法,其特征在于,所述对待执行算法进行测试,得到算法耗时,包括:
4.如权利要求2所述的GPU资源管理方法,其特征在于,所述根据所述算法耗时将所述待执行算法部署在相应的NODE节点,包括:
5.如权利要求1所述的GPU资源管理方法,其特征在于,所述当所述待执行算法在相应的NODE节点上执行时,根据所述待执行算法的GPU资源使用情况,对相应的N
...【技术特征摘要】
1.一种gpu资源管理方法,其特征在于,包括:
2.如权利要求1所述的gpu资源管理方法,其特征在于,所述对集群内的node节点进行分类,包括:
3.如权利要求2所述的gpu资源管理方法,其特征在于,所述对待执行算法进行测试,得到算法耗时,包括:
4.如权利要求2所述的gpu资源管理方法,其特征在于,所述根据所述算法耗时将所述待执行算法部署在相应的node节点,包括:
5.如权利要求1所述的gpu资源管理方法,其特征在于,所述当所述待执行算法在相应的node节点上执行时,根据所述待执行算法的gpu资源使用情况,对相应的node节点进行扩缩容操作,包括:
6.如权利要求5所述的gpu资源管理方法,其特征在于,所述根据所述比较结果,对所述...
【专利技术属性】
技术研发人员:谢子元,刘春阳,孔令军,张海涛,谢倩,
申请(专利权)人:中移物联网有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。