一种虚拟化的算力提供方法及系统技术方案

技术编号:35197816 阅读:16 留言:0更新日期:2022-10-12 18:31
本申请公开了一种虚拟化的算力提供方法及系统,该虚拟化的算力提供方法包括:获取集群管控请求,其中,集群管控请求包括虚拟算力设备的部署请求;根据部署请求,从计算节点的内核空间获取虚拟算力设备,并在计算节点的用户空间生成与虚拟算力设备对应的服务程序;将虚拟算力设备挂载至用户容器;通过虚拟算力设备和服务程序,在资源集合中为用户容器提供的目标应用调度物理资源,其中,物理资源与虚拟算力设备形成有映射关系;通过虚拟算力设备和服务程序,获取目标应用的运行结果,以及将运行结果发送给用户容器。通过本申请解决现有技术中由于软硬件不同,且缺乏统一协议对软件栈的规范,导致适用性差的问题,达到适配多场景的技术效果。的技术效果。的技术效果。

【技术实现步骤摘要】
一种虚拟化的算力提供方法及系统


[0001]本申请涉及到互联网技术应用领域,具体而言,涉及一种虚拟化的算力提供方法及系统。

技术介绍

[0002]人工智能作为一个新兴的领域,近年来得到快速的发展,在学术界和工业界都涌现出非常多的新兴算法和应用。人工智能的三大要素是算法、算力和数据。其中算力是实现算法的最终载体。图1是现有技术中AI应用程序到硬件的层级关系的示意图,如图1所示为AI应用程序(算法)到硬件(算力)的层级关系,由于底层硬件的不同,其上的每一层都有不同的实现,目前并没有形成一个统一的协议来规范从上到下的软件栈,因而用户使用、执行算法时,需要适配各种不同的软硬件才能使能并取得满足数据处理需求的使用效果。
[0003]针对目前相关技术中由于软硬件不同,且缺乏统一协议对软件栈的规范,导致适用性差的问题,目前尚未得到有效的解决。

技术实现思路

[0004]本申请实施例提供了一种虚拟化的算力提供方法及系统,以至少解决现有技术中由于软硬件不同,且缺乏统一协议对软件栈的规范,导致适用性差的问题。
[0005]根据本申请的一个方面,提供了一种虚拟化的算力提供方法,包括:获取集群管控请求,其中,集群管控请求包括虚拟算力设备的部署请求;根据部署请求,从计算节点的内核空间获取虚拟算力设备,并在计算节点的用户空间生成与虚拟算力设备对应的服务程序;将虚拟算力设备挂载至用户容器;通过虚拟算力设备和服务程序,在资源集合中为用户容器提供的目标应用调度物理资源,其中,物理资源与虚拟算力设备形成有映射关系;通过虚拟算力设备和服务程序,获取目标应用的运行结果,以及将运行结果发送给用户容器。
[0006]可选的,该方法还包括:根据部署请求在内核空间创建虚拟算力设备。
[0007]可选的,虚拟算力设备提供有统一的数据接口;其中,通过虚拟算力设备和服务程序,在资源集合中为用户容器提供的目标应用调度物理资源包括:通过虚拟算力设备提供的数据接口,获取用户容器提供的目标应用,其中,目标应用包括用户数据和用户数据的计算指令;通过共享内存将目标应用从虚拟算力设备发送给服务程序;通过服务程序将目标应用发送给虚拟算力设备对应的物理资源。
[0008]进一步地,可选的,物理资源为资源集合异构物理资源或同构物理资源,资源集合与服务程序通过连接池连接,其中,连接池中的协议包括:本地传输协议和网络传输协议。
[0009]可选的,本地传输协议包括:PCIe;网络传输协议包括以下至少之一:RDMA、TCP。
[0010]可选的,虚拟算力设备提供有统一的管控接口;该方法还包括:通过虚拟算力设备的管控接口获取用户容器提供的管控请求,其中,管控请求包括以下至少之一:算力查询请求、算力配置请求、传输通道属性配置请求、算力迁移请求、虚拟算力设备的状态查询请求、虚拟算力设备的状态配置请求;通过服务程序处理管控请求。
[0011]进一步地,可选的,在管控请求为算力配置请求的情况下,通过服务程序处理算力配置请求包括:通过服务程序将算力配置请求发送给物理资源管理节点,以供物理资源管理节点为虚拟算力设备和物理资源建立映射关系。
[0012]可选的,集群管控请求还包括以下至少之一:虚拟算力设备的运行状态查询请求、虚拟算力设备的删除请求;集群管控请求通过设备插件从集群管控中心获取。
[0013]可选的,集群管控请求由设备管控中心管理,该方法还包括:检测和存储服务程序和/或设备管控中心的状态,并在服务程序和/或设备管控中心的状态异常的情况下,根据存储的服务程序和/或设备管控中心的状态进行系统恢复。
[0014]可选的,虚拟算力设备以块设备、字符设备或网络设备的形式模拟。
[0015]根据本申请的另一个方面,提供了一种虚拟化的算力提供系统,包括:设备管控中心,用于获取集群管控请求,其中,集群管控请求包括虚拟算力设备的部署请求;设备管控中心,还用于根据部署请求,从计算节点的内核空间获取虚拟算力设备,并在计算节点的用户空间生成与虚拟算力设备对应的服务程序;设备管控中心,还用于将虚拟算力设备挂载至用户容器;虚拟算力设备和服务程序,用于在资源集合中为用户容器提供的目标应用调度物理资源,其中,物理资源与虚拟算力设备形成有映射关系;虚拟算力设备和服务程序,还用于获取目标应用的运行结果,以及将运行结果发送给用户容器。
[0016]可选的,物理资源为资源集合提供的异构物理资源或同构物理资源,资源集合与服务程序通过连接池连接,其中,连接池中的协议包括:本地传输协议和网络传输协议;本地传输协议包括:PCIe;网络传输协议包括以下至少之一:RDMA、TCP。
[0017]可选的,该系统还包括:检测中心,检测中心用于检测服务程序和/或设备管控中心的状态。
[0018]进一步地,可选的,该系统还包括:设备管理文件系统,用于存储服务程序和/或设备管控中心的状态,以在服务程序和/或设备管控中心的状态异常的情况下,根据存储的服务程序和/或设备管控中心的状态进行系统恢复。
[0019]在本申请实施例中,通过获取集群管控请求,其中,集群管控请求包括虚拟算力设备的部署请求;根据部署请求,从计算节点的内核空间获取虚拟算力设备,并在计算节点的用户空间生成与虚拟算力设备对应的服务程序;将虚拟算力设备挂载至用户容器;通过虚拟算力设备和服务程序,在资源集合中为用户容器提供的目标应用调度物理资源,其中,物理资源与虚拟算力设备形成有映射关系;通过虚拟算力设备和服务程序,获取目标应用的运行结果,以及将运行结果发送给用户容器。通过本申请解决现有技术中由于软硬件不同,且缺乏统一协议对软件栈的规范,导致适用性差的问题,达到适配多场景的技术效果。
附图说明
[0020]构成本申请的一部分的附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
[0021]图1是根据本申请实施例一的一种虚拟化的算力提供系统的示意图;
[0022]图2是根据本申请实施例一的一种虚拟化的算力提供系统中底层资源与虚拟算力设备交互的示意图;
[0023]图3是根据本申请实施例一的一种虚拟化的算力提供系统中虚拟算力设备的系统
框架的示意图;
[0024]图4是根据本申请实施例二的一种虚拟化的算力提供方法的流程示意图;
[0025]图5是根据本申请实施例二的一种虚拟化的算力提供方法中创建虚拟设备与启动服务线程/进程的示意图;
[0026]图6是根据本申请实施例二的一种虚拟化的算力提供方法中基于虚拟设备的算力配置和调用流程的示意图;
[0027]图7是根据本申请实施例二的一种虚拟化的算力提供方法中设备管控与分配流程的示意图。
具体实施方式
[0028]需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
[0029]需要说明的是,在附图的流程图示出的步骤可本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种虚拟化的算力提供方法,包括:获取集群管控请求,其中,所述集群管控请求包括虚拟算力设备的部署请求;根据所述部署请求,从计算节点的内核空间获取虚拟算力设备,并在所述计算节点的用户空间生成与所述虚拟算力设备对应的服务程序;将所述虚拟算力设备挂载至用户容器;通过所述虚拟算力设备和所述服务程序,在资源集合中为所述用户容器提供的目标应用调度物理资源,其中,所述物理资源与所述虚拟算力设备形成有映射关系;通过所述虚拟算力设备和所述服务程序,获取所述目标应用的运行结果,以及将所述运行结果发送给所述用户容器。2.根据权利要求1所述的虚拟化的算力提供方法,其中,所述方法还包括:根据所述部署请求在所述内核空间创建所述虚拟算力设备。3.根据权利要求1所述的虚拟化的算力提供方法,其中,所述虚拟算力设备提供有统一的数据接口;其中,通过所述虚拟算力设备和所述服务程序,在资源集合中为所述用户容器提供的目标应用调度物理资源包括:通过所述虚拟算力设备提供的所述数据接口,获取所述用户容器提供的目标应用,其中,所述目标应用包括用户数据和所述用户数据的计算指令;通过共享内存将所述目标应用从所述虚拟算力设备发送给所述服务程序;通过所述服务程序将所述目标应用发送给所述虚拟算力设备对应的物理资源。4.根据权利要求3所述的虚拟化的算力提供方法,其中,所述物理资源为资源集合异构物理资源或同构物理资源,所述资源集合与所述服务程序通过连接池连接,其中,所述连接池中的协议包括:本地传输协议和网络传输协议。5.根据权利要求4所述的虚拟化的算力提供方法,其中,所述本地传输协议包括:PCIe;所述网络传输协议包括以下至少之一:RDMA、TCP。6.根据权利要求1所述的虚拟化的算力提供方法,其中,所述虚拟算力设备提供有统一的管控接口;所述方法还包括:通过所述虚拟算力设备的所述管控接口获取所述用户容器提供的管控请求,其中,所述管控请求包括以下至少之一:算力查询请求、算力配置请求、传输通道属性配置请求、算力迁移请求、虚拟算力设备的状态查询请求、虚拟算力设备的状态配置请求;通过所述服务程序处理所述管控请求。7.根据权利要求6所述的虚拟化的算力提供方法,其中,在所述管控请求为所述算力配置请求的情况下,通过所述服务程序处理所述算力配置请求包括:通过所述服务程序将所述算力配置请求发送给物理资源管理节点,以...

【专利技术属性】
技术研发人员:李继平王一静
申请(专利权)人:阿里巴巴中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1