【技术实现步骤摘要】
用于管理资源的方法、服务器系统和计算机程序产品
本公开的实施例涉及计算机领域,并且更具体地,涉及一种用于管理资源的方法、服务器系统以及计算机程序产品。
技术介绍
目前,很多数据处理和计算的任务依赖于专用处理器来执行。例如,图形处理单元(GPU)是一种已知的专用处理器,其被用于在个人计算机、工作站、游戏机和移动设备上进行加速运算。同时利用GPU和中央处理单元(CPU)能够提供GPU加速计算。GPU加速计算能够将应用程序的计算密集的工作负荷转移到GPU上,而其余程序代码仍由CPU运行。从用户的角度来看,应用程序的运行速度明显加快。如今,为了给诸如高性能计算(HPC)、机器学习(ML)或深度学习(DL)之类的密集型计算任务提供更好的服务,越来越多的公有云或数据中心开始部署GPU实例,以供这些密集型计算任务使用。这些公有云或数据中心中部署的GPU实例由不同租户的应用共享。然而,这些公有云或数据中心仅仅是简单地尝试部署GPU实例,目前尚处于初级阶段。到目前为止,没有在多个应用之间对这种共享的GPU中的资源进行服务质量(QoS)控制的方案。其他类型的专用处理器同样面对类似的问 ...
【技术保护点】
1.一种用于管理资源的方法,包括:接收来自应用的针对第一量的专用处理单元资源的请求,所述应用具有已分配的优先级;基于所述请求确定所述应用将会占用的所述专用处理单元资源的总量;以及响应于所述总量接近或超出与所述优先级相关联的预定限额,为所述应用分配所述第一量的通用处理单元资源。
【技术特征摘要】
1.一种用于管理资源的方法,包括:接收来自应用的针对第一量的专用处理单元资源的请求,所述应用具有已分配的优先级;基于所述请求确定所述应用将会占用的所述专用处理单元资源的总量;以及响应于所述总量接近或超出与所述优先级相关联的预定限额,为所述应用分配所述第一量的通用处理单元资源。2.根据权利要求1所述的方法,其中所述专用处理单元资源包括图形处理单元(GPU)的存储资源,并且所述通用处理单元资源包括中央处理单元(CPU)的存储资源。3.根据权利要求2所述的方法,其中所述专用处理单元资源和所述通用处理单元资源借助于共享指针而统一编址,并且分配所述第一量的通用处理单元资源包括:设置所述共享指针指向为所述应用分配的所述第一量的通用处理单元资源;以及向所述应用返回所述指针的信息。4.根据权利要求1所述的方法,还包括:响应于所述应用释放了先前占用的所述专用处理单元资源的一部分,确定所述应用在释放后占用的所述专用处理单元资源的总量是否低于所述预定限额达到阈值差异;以及响应于达到所述阈值差异,将占用已分配的所述通用处理单元资源的数据的至少一部分迁移到所述专用处理单元资源。5.根据权利要求1所述的方法,还包括:检测所述专用处理单元资源的使用率;响应于所述使用率超出预定阈值,向所述应用发送信号以指示所述应用延迟发送针对所述专用处理单元资源的下一请求。6.根据权利要求1所述的方法,还包括:从所述应用接收所述预定限额的指示。7.一种服务器系统,包括:专用处理单元;通用处理单元;以及控制器,所述控制器被配置为:接收来自应用的针对第一量的专用处理单元资源的请求,所述应用具有已分配的优先级;基于所述请求确定所述应用将会占用的所述专用处理单元资源的总量;以及响应于所述总量接近或超出与所述优先级相关联的预定限额,为所述应用分配所述第一量的通用处理单元资源。8.根据权利要求7所述的服务器系统,其中所述专用处理单元资源包括图形处理单元(GPU)的存储资源,并且所述通用处理单元资源包括中央处理单元(CPU)的存储资源。9.根据权利要求8所述的服务器系统,其中所述专用处理单元资源和所述通用处理单元资源借助于共享指针而统一编址,并且分配所述第一量的通用处理单元资源包括:设置所述共享指针指向为所述应用分配的所述第一量的通用处理单元资源;以及向所述应用返回所述指针的信息。10.根据权利要求7所述的服务器系统,其中所述控制器还被配置为:响...
【专利技术属性】
技术研发人员:赵军平,郭帆,王鲲,
申请(专利权)人:伊姆西IP控股有限责任公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。