干扰感知的GPU异构集群调度方法、系统及介质技术方案

技术编号:32836963 阅读:32 留言:0更新日期:2022-03-26 20:58
本申请公开了干扰感知的GPU异构集群调度方法、系统及介质,其中,所述低噪声放大器包括:该干扰感知的GPU异构集群调度方法包括:从至少一个共享GPU组合中,获取最小干扰的目标共享GPU组合;对所述目标共享GPU组合采用贝叶斯优化寻找目标超参数组合,直到收敛;采用所述目标超参数组合运行目标深度学习负载,以实现调度算法的性能评估。本申请实施例提供的干扰感知的GPU异构集群调度方法,在上层应用层面,当前的GPU共享大多是针对与一种深度学习框架进行设计,未考虑不同框架实现的深度学习应用在不同参数下的运行时特征。应用在不同参数下的运行时特征。应用在不同参数下的运行时特征。

【技术实现步骤摘要】
干扰感知的GPU异构集群调度方法、系统及介质


[0001]本申请属于计算机
,具体涉及一种干扰感知的GPU异构集群调度方法、系统及介质。

技术介绍

[0002]人工智能的迅速发展使得涌现出越来越多的深度学习应用,而该类应用在运行时需要海量的训练数据和高性能计算能力,促使了高性能芯片如GPU、FPGA、TPU和AISC等的产生和应用。为了满足上层深度学习应用对计算和存储能力的需求,Kubernetes因其可移植、可扩展和自修复的特征成为目前工业界和学术界广泛应用的深度学习容器应用的编排工具。
[0003]然而,针对于异构集群上的深度学习应用在调度时面临着诸多问题和挑战。一方面,由于上层应用网络结构日趋复杂,种类繁多,资源需求和运行时性能难以预测。另一方面,容器独占GPU的方式虽然在一定程度上实现了资源隔离,但显卡资源价格昂贵,应用请求和计算资源供需不均衡,应用往往存在超时等待的问题。

技术实现思路

[0004]本申请的一个目的是解决至少上述问题和/或缺陷,并提供至少后面将说明的优点。
[0005]本申请提供的本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种干扰感知的GPU异构集群调度方法,其特征在于,所述方法包括:从至少一个共享GPU组合中,获取最小干扰的目标共享GPU组合;对所述目标共享GPU组合采用贝叶斯优化寻找目标超参数组合,直到收敛;采用所述目标超参数组合运行目标深度学习负载,以实现调度算法的性能评估。2.根据权利要求1所述的方法,其特征在于,在从至少一个共享GPU组合中,获取最小干扰的目标共享GPU组合之前,所述方法还包括:获取至少一个第一深度学习负载;采用所述贝叶斯优化寻找所述至少一个第一深度学习负载的超参数组合;采用每个第一深度学习负载的超参数组合,分别离线运行每个第一深度学习负载应用共享GPU,以得到至少一个性能干扰分数;根据所述至少一个性能干扰分数,确定所述至少一个共享GPU组合对应的干扰。3.根据权利要求2所述的方法,其特征在于,所述根据所述至少一个性能干扰分数,确定所述至少一个共享GPU组合对应的干扰,包括:在线场景时,对新的深度学习负载应用所述至少一个共享GPU组合和所述至少一个性能干扰分数,确定所述至少一个共享GPU组合对应的干扰。4.根据权利要求2所述的方法,其特征在于,所述采用每个第一深度学习负载的超参数组合,分别离线运行每个第一深度学习负载应用共享GPU,以得到至少一个性能干扰分数,包括:基于目标算法,采用所述每个第一深度学习负载的超参数组合,分别离线运行所述每个第一深度学习负载应用共享GPU,以得到所述至少一个性能干扰分数。5.根据权利要求1所述的方法,其特征在于,所述目标深度学习负载包括以下至少一项:自然语言处理系统、人脸识别系统、目标检测系统、图像分类系...

【专利技术属性】
技术研发人员:叶可江陈文艳须成忠
申请(专利权)人:中国科学院深圳先进技术研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1