The embodiment of the invention discloses a graphic processing device. The logic unit is the smallest unit of GPU resource scheduling, the graphics processing apparatus for mapping of at least one GPU multi process GPU-MPS proxy server, GPU-MPS scheduling is the agent of the graphics processing unit, a GPU-MPS client can dispatch at least one logical unit, a task corresponds to a client GPU-MPS, the graphics maximum number of logical unit processing device can be included as M * N * K; the number of logic unit M is a client of GPU-MPS scheduling, N is the maximum number of clients included in a GPU-MPS, K for the graphics processing unit mapping GPU-MPS number. Through the application, the utilization rate of the GPU resource can be improved, and the cost of establishing and switching the GPU context can be saved for the graphics processing device. The invention also discloses a resource service device, a resource scheduling method and a device.
【技术实现步骤摘要】
本申请涉及计算机应用领域,特别是涉及图形处理装置、资源服务装置、资源调度方法和装置。
技术介绍
由于在现代的计算机中,图形的处理越来越重要,因此,需要一种专门用于图形处理的核心处理器,而图形处理器(GPU,Graphics Processing Unit)就是一种专门用于图形处理的器件。与此同时,把GPU的强大的计算能力处理通用计算(GPGPU,General Purpose GPU)也日益盛行,用于各种高性能计算集群中。目前,在现有的GPU集群技术中,当处理用户提交的作业(job)时,主要存在两种GPU资源的调度方法。其中,一种调度方法是,资源调度器将一个GPU(如,一张GPU卡)只调度给一个用户的作业。另一种调度方法是,资源调度器将一个GPU同时调度给多个用户的作业。在实现本申请的过程中,本申请的专利技术人发现现有技术中至少存在如下问题:在第一种调度方法中,由于一个GPU只被一个用户的作业独占,而一个用户的作业很可能无法充分利用一个GPU的资源,因此会出现GPU资源利用率低的问题。而在第二种调度方法中,由于一个GPU是被多个用户的作业共享的,而多个用户更有可能会充分利用一个GPU的资源,因此一定程度上提高了GPU资源的利用率。虽然第二种调度方法可以提高GPU资源的利用率,但是,当多个用户的作业共享一个GPU时,多个用户的作业同时开启的进程数可能会很大,对于每一个进程,GPU都要为其建立一个GPU上下文,因此,在GPU上建立的GPU上下文的数量也就可能非常大,并且,还会在数量众多的GPU上下文中进行切换,建立和切换GPU上下文会使GPU资源产生巨大开销 ...
【技术保护点】
一种图形处理装置,其特征在于,在所述图形处理装置中,逻辑单元是最小的图形处理器GPU资源调度单元,所述图形处理装置映射至少一个GPU多进程代理服务器GPU‑MPS,所述GPU‑MPS为调度所述图形处理装置的代理,GPU‑MPS的一个客户端可调度至少一个所述逻辑单元,一个任务进程为GPU‑MPS的一个客户端,所述图形处理装置可包含的最大逻辑单元数为M×N×K个;其中,M为GPU‑MPS的一个客户端可调度的逻辑单元数,N为一个GPU‑MPS包含的最大客户端数,K为所述图形处理装置映射的GPU‑MPS数,M、N和K均为非零正整数。
【技术特征摘要】
1.一种图形处理装置,其特征在于,在所述图形处理装置中,逻辑单元是最小的图形处理器GPU资源调度单元,所述图形处理装置映射至少一个GPU多进程代理服务器GPU-MPS,所述GPU-MPS为调度所述图形处理装置的代理,GPU-MPS的一个客户端可调度至少一个所述逻辑单元,一个任务进程为GPU-MPS的一个客户端,所述图形处理装置可包含的最大逻辑单元数为M×N×K个;其中,M为GPU-MPS的一个客户端可调度的逻辑单元数,N为一个GPU-MPS包含的最大客户端数,K为所述图形处理装置映射的GPU-MPS数,M、N和K均为非零正整数。2.根据权利要求1所述的图形处理装置,其特征在于,GPU-MPS的一个客户端可调度一个逻辑单元。3.根据权利要求1或2所述的图形处理装置,其特征在于,所述图形处理装置映射一个GPU多进程代理服务器。4.根据权利要求1所述的图形处理装置,其特征在于,所述图形处理装置包含M×N×K个逻辑单元。5.一种资源服务装置,其特征在于,包括至少一个如权利要求1至4中任意一项所述的图形处理装置、监测单元和第一通信单元,其中,监测单元,用于在监测周期到达时,监测当前周期内所述图形处理装置中剩余的逻辑单元的数量;第一通信单元,用于将监测到的数据发送给集群中的监控节点,以便所述监控节点在更新周期到达时利用监测到的数据原子更新预设的资源动态表;其中,所述资源动态表至少包含图形处理装置中剩余的逻辑单元的数量。6.根据权利要求5所述的资源服务装置,其特征在于,所述资源服务装置为集群中的一个从节点。7.根据权利要求5所述的资源服务装置,其特征在于,所述资源动态表还包含图形处理装置的实际使用率;所述监测单元还用于,在监测周期到达时,监测当前周期内本地的图形处理装置的实际使用率。8.一种资源调度方法,其特征在于,应用在如权利要求5至7中任意一
\t项所述的资源服务装置,所述方法包括:接收为目标作业调度图形处理器GPU资源的调度请求,所述调度请求中指示了请求调度的逻辑单元的数量;响应于所述调度请求,从预设的资源动态表中查找剩余的逻辑单元的数量不为零的图形处理装置,并按照所述调度请求指示的数量,从查找到的图形处理装置中为所述目标作业调度逻辑单元;其中,所述...
【专利技术属性】
技术研发人员:孔建钢,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛;KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。