一种分配资源的方法及装置制造方法及图纸

技术编号:32851901 阅读:28 留言:0更新日期:2022-03-30 19:09
一种分配资源的方法及装置,方法包括:服务器将视频压缩卡或者图形处理器等加速硬件的资源分解为多个单位算力;当所述服务器接收容器或虚拟机中的应用发送的算力申请请求时;所述服务器为所述应用分配算力,从而可提升加速资源的利用效率。速资源的利用效率。速资源的利用效率。

【技术实现步骤摘要】
一种分配资源的方法及装置


[0001]本申请计算机
,尤其涉及一种分配资源的方法及装置。

技术介绍

[0002]随着机器学习技术及云计算技术的发展,传统的中央处理器(central processing unit,简称CPU)资源算力已经无法满足海量数据的分析和计算请求。基于数据处理的需求,当前针对不同的业务需求针对性开发配套的加速硬件,例如图形处理器(graphics processing unit,简称GPU)能够大幅提高图形数据的计算效率,视频压缩卡能够提高视频图像的压缩效率,这一些加速硬件的资源可统称为加速资源。当前主流的数据处理系统都是基于容器或者虚拟机进行业务部署的,对于加速资源的使用方式,通常是直接将加速硬件直通到容器/虚拟机内部,在业务处理过程中,容器/虚拟机中执行的应用直接调用加速硬件提供的接口进行加速资源的申请和使用。因此在实际使用场景中,一个加速资源的全部算力由一个容器或者虚拟机独占。但是在现有的云计算场景下,各类业务并不是持续在使用申请的加速资源,可能会存在部分空闲时段,这种独占加速资源的方式将导致无法充分利用加速本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种分配资源的方法,其特征在于,包括:服务器将加速硬件对应的加速资源分解为多个单位算力,其中,所述服务器包括多个所述加速硬件;所述服务器接收容器或虚拟机中的应用发送的算力申请请求,所述容器或者虚拟器中运行所述应用;所述服务器为所述应用分配包括一个或者多个所述单位算力的算力。2.根据权利要求1所述的方法,其特征在于,其中:所述多个单位算力中,至少一个单位算力的加速资源是来自于复数个所述加速硬件。3.根据权利要求1所述的方法,其特征在于,其中:多个所述单位算力的加速资源来自于同一个加速硬件。4.根据权利要求1所述的方法,其特征在于,所述服务器将加速硬件对应的加速资源分解为多个单位算力,包括:所述服务器根据所述加速资源所对应业务的规格,以及加速硬件的硬件规格,对所述加速资源进行算力分解,将所述加速资源的计算能力分解为多个单位算力。5.根据权利要求4所述的方法,其特征在于,所述服务器根据所述加速资源所对应业务的规格,以及加速硬件的硬件规格,对所述加速资源进行算力分解,包括:所述服务器根据所述加速资源所对应业务的最小规格,以及加速资源的硬件规格,对所述加速资源进行算力分解。6.根据权利要求1所述的方法,其特征在于,在所述服务器将加速硬件对应的加速资源分解为多个单位算力之前,所述方法还包括:所述服务器获取算力分配策略的配置信息;所述服务器为所述应用分配包括一个或者多个所述单位算力的算力,包括:所述服务器根据所述配置信息和所述算力申请请求,为所述应用分配包括一个或者多个所述单位算力的算力;其中,所述配置信息中包括以下至少一种:加速资源负载均衡的分配策略信息;业务优先级信息;容器优先级信息或虚拟机优先级信息。7.根据权利要求1-5任一项所述的方法,所述加速资源包括以下至少一种:视频压缩卡的视频压缩资源;图形处理器的视频解码资源。8.根据权利要求1-6任一项所述的方法,其特征在于,所述服务器为所述应用分配包括一个或者多个所述单位算力的算力,包括:所述服务器调用所述加速硬件的驱动,申请与被分配的算力对应的物理资源;所述驱动为所述应用提供被分配的算力对应的加速资源。9.根据权利要求1-8任一项所述的方法,所述服务器为所述应用分配包括一个或者多个所述单位算力的算力,包括:所述服务器调用所述加速硬件的驱动,申请与被分配的算力对应的物理资源;所述服务器接收所述驱动返回的算力标识,所述算力标识与分配给所述应用的物理资
源对应,将所述算力标识发送给所述应用,所述算力标识用于当所述应用发送所述算力标识给所述驱动时,所述驱动为所述应用分配所述算力标识对应的加速资源。10.一种...

【专利技术属性】
技术研发人员:林星黄堆荣
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1