【技术实现步骤摘要】
一种共享GPU资源的容器调度系统及调度方法
[0001]本专利技术属于图形处理器资源调度领域,尤其涉及一种共享GPU资源的容器调度系统及调度方法。
技术介绍
[0002]本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息,不必然构成在先技术。
[0003]随着现实场景中各应用领域对计算需求的提升,图形处理器(GPU)资源凭借其强大的计算能力、高内存宽带和海量数据级并行计算模型等优势,得到了数据中心不同应用平台的广泛应用,使得GPU集群的规模不断扩大。但由于GPU昂贵的价格,在数据中心中属于不同计算应用平台争取的稀缺性资源。若采取公平分配原则,由于各平台的GPU资源使用情况各不相同,当某一平台GPU资源不满足平台需求的同时,其余应用平台GPU资源可能存在闲置情况,将造成GPU资源的浪费。
[0004]基于此情况,考虑各平台共享彼此GPU资源来提升数据中心整体的GPU资源利用率。若从物理级节点考虑,各平台GPU计算节点隶属于某一资源调度系统,调度系统架构以及技术组件各不相同,不支持彼此之间GPU资源的共享。若 ...
【技术保护点】
【技术特征摘要】
1.一种共享GPU资源的容器调度系统,其特征在于,包括:容器化模块,其被配置为:获取多个异构应用平台的GPU任务信息,并将GPU任务容器化;容器调度模块,其被配置为:接收各个平台的GPU容器任务,根据所需资源大小,形成容器任务队列;接收GPU资源管理模块反馈的GPU信息,将容器调度到相应的GPU节点,执行容器任务;GPU资源管理模块,其被配置为:监控GPU资源使用情况,将GPU资源根据GPU卡的属性形成资源管理队列,接收发送的资源请求,基于容器请求信息和调度策略,选择容器任务所需的GPU卡,并根据GPU卡的相关节点信息为容器指定GPU资源。2.根据权利要求1所述的一种共享GPU资源的容器调度系统,其特征在于,GPU资源管理模块中,所述接收发送的资源请求,基于容器请求信息和调度策略,选择容器任务所需的GPU卡,并根据GPU卡的相关节点信息为容器指定GPU资源,具体包括:读取资源队列第一位的GPU资源信息,并锁定当前资源GPU节点;判断当前锁定GPU资源是否满足任务需求,若满足,在锁定的GPU资源中,根据调度策略选取GPU节点,否则读取资源队列下一位的GPU资源信息,释放原来锁定的GPU节点资源,直到队列为空;锁定资源队列最后一位的GPU资源,读取GPU资源信息;根据任务请求与锁定的GPU资源信息,上线不少于所需GPU卡数量的GPU节点,锁定上线节点。3.根据权利要求1所述的一种共享GPU资源的容器调度系统,其特征在于,所述系统还包括容器任务反馈模块,其被配置为:监控容器任务执行情况,接收应用平台的任务查询请求,将任务情况反馈到客户指定的目录,并在容器任务完成后,将任务结果反馈到客户指定目录。4.根据权利要求1所述的一种共享GPU资源的容器调度系统,其特征在于,所述多个异构应用平台包括:高性能计算应用平台、云计算应用平台和人工智能应用平台。5.根据权利要求1所述的一种共享GPU资源的容器调度系统,其特征在于,所述共享GPU资源的容器调度系统部署在Kubernetes集群上,包括控制节点和计算节点,所述控制节点和计算节...
【专利技术属性】
技术研发人员:王继彬,刘鑫,郭莹,潘岩,潘景山,吴晓明,杨美红,
申请(专利权)人:齐鲁工业大学山东省科学院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。