【技术实现步骤摘要】
【国外来华专利技术】专用处理单元的功能即服务(FAAS)模型
[0001]相关申请的交叉引用
[0002]本专利申请要求于2020年3月12日提交的美国实用专利申请序列号16/817,390的优先权,该申请通过引用的方式全部并入本文。
[0003]本公开总体涉及提供专用处理单元,例如图形处理单元(GPU)、张量处理单元(TPU)等作为服务,使专用处理单元的核可用于边缘客户端计算设备。
技术介绍
[0004]在当今无所不在的计算世界中,架构继续向边缘计算发展,其中计算设备获取和处理尽可能接近源的数据。边缘计算提供了许多好处,包括减少延迟和减少跨网络的数据带宽成本。然而,某些类型的处理可能非常密集,以至于需要比许多边缘计算设备所能提供的更多的功率。因此,边缘计算面临着一个冲突,即继续将数据处理进一步推向源,而无需在不断增加的边缘计算设备上添加昂贵的硬件。
附图说明
[0005]下面参照附图来阐述具体实施方式。在附图中,附图标记最左边的(一个或多个)数字表示该附图标记首次出现的附图。在不同的附图中使用相同的附图标记表示相似或相同的项目。附图中描绘的系统未按比例绘制,并且附图中的组件可能彼此未按比例绘制。
[0006]图1示出了示例环境的系统架构图,其中处理单元服务可通过网络由不同的客户端设备访问。在所示环境中,每个客户端设备可以包括边缘计算设备,该边缘计算设备被配置为在本地处理一些数据,同时调用一个或多个专用处理单元(例如,处理单元服务的图形处理单元(GPU))的核用于执行某些并行的、密集的计算任务。在 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种方法,包括:在包括图形处理单元(GPU)的服务器处,从远离所述服务器的第一应用接收第一请求,所述第一请求要求将所述GPU的第一数量的核保留第一时间量;在所述服务器处,从远离所述服务器且远离所述第一应用的第二应用接收第二请求,所述第二请求要求将所述GPU的第二数量的核保留第二时间量,所述第二时间量与所述第一时间量至少部分地重叠;由所述服务器确定所述第一请求与比所述第二请求更高的优先级相关联;由所述服务器至少部分地基于所述确定,为所述第一应用将所述第一数量的核保留所述第一时间量;以及由所述服务器向所述第一应用发送指示出所述第一数量的核已经为所述第一应用保留了所述第一时间量的指示。2.根据权利要求1所述的方法,还包括:由所述服务器至少部分地基于所述确定,为所述第二应用将第三数量的核保留所述第二时间量,所述第三数量的核少于由所述第二应用请求的所述第二数量的核;以及由所述服务器向所述第二应用发送指示出所述第三数量的核已经为所述第二应用保留了所述第二时间量的指示。3.根据权利要求1或2所述的方法,还包括:由所述服务器至少部分地基于所述确定,为所述第二应用将所述第二数量的核保留第三时间量,所述第三时间量满足以下项中的至少一项:小于所述第二时间量、或发生在所述第二时间量之后;以及由所述服务器向所述第二应用发送指示出所述第二数量的核已经为所述第二应用保留了所述第三时间量的指示。4.根据权利要求1、2或3所述的方法,其中,所述确定所述第一请求与比所述第二请求更高的优先级相关联至少部分地基于以下各项中的至少一项:要由所述第一应用执行的任务、要由所述第二应用执行的任务、与所述第一应用相关联的服务质量(QoS)级别、与所述第二应用相关联的QoS级别、与所述第一应用相关联的计费模型、或与所述第二应用相关联的计费模型。5.根据权利要求1、2、3或4所述的方法,其中,所述确定所述第一请求与比所述第二请求更高的优先级相关联至少部分地基于以下各项中的至少一项:由所述第一应用请求的核的所述第一数量、所述第一应用已经请求所述第一数量的核的所述第一时间量、由所述第二应用请求的核的所述第二数量、或所述第二应用已经请求所述第二数量的核的所述第二时间量。6.根据前述权利要求中任一项所述的方法,其中,所述服务器形成基于云的服务的一部分,接收所述第一请求包括经由由所述基于云的服务提供的应用编程接口(API)接收所述第一请求,并且接收所述第二请求包括经由由所述基于云的服务提供的所述API接收所述第二请求。7.根据前述权利要求中任一项所述的方法,其中,所述第一请求包括与所述第一应用相关联的第一认证凭证,并且所述方法还包括:至少部分地在保留所述第一数量的核和发送所述指示之前,使用与所述第一应用相关
联的所述第一认证凭证来认证所述第一应用。8.一种系统,包括:一个或多个第一处理器,包括图形处理单元(GPU)或张量处理单元(TPU)中的至少一者;一个或多个第二处理器;和存储计算机可执行指令的一个或多个计算机可读介质,所述计算机可执行指令当被执行时,使所述一个或多个第二处理器执行动作,所述动作包括:从远离所述系统的第一应用接收第一请求,所述第一请求要求将所述GPU或所述TPU中的至少一者的第一数量的核保留第一时间量;从远离所述系统且远离所述第一应用的第二应用接收第二请求,所述第二请求要求将所述GPU或所述TPU中的至少一者的第二数量的核保留第二时间量,所述第二时间量与所述第一时间量至少部分地重叠;确定所述第一请求与比所述第二请求更高的优先级相关联;至少部分地基于所述确定,为所述第一应用将所述第一数量的核保留所述第一时间量;以及向所述第一应用发送指示出所述第一数量的核已经为所述第一应用保留了所述第一时间量的指示。9.根据权利要求8所述的系统,所述动作还包括:至少部分地基于所述确定,为所述第二应用将第三数量的核保留所述第二时间量,所述第三数量的核少于由所述第二应用请求的所述第二数量的核;以及向所述第二应用发送指示出所述第三数量的核已经为所述第二应用保留了所述第二时间量的指示。10.根据权利要求8或9所述的系统,所述动作还包括:至少部分地基于所述确定,为所述第二应...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。