The invention provides a GPU virtualization QoS control system and method based on adaptive configuration of resource sharing. The invention realizes GPU resource capacity sharing and allocation among all virtualized cloud computing workloads under the constraints of QoS by monitoring module, control module and scheduling module. The invention significantly improves the QoS stability of concurrently running graphics loads in a virtualized cloud system platform based on virtualized GPU resources. Compared with other traditional QoS control methods, the stability degree of load frame rate is significantly improved. At the same time, on the premise of maintaining the stable and smooth operation of all concurrent workloads, the occupancy rate of GPU computing resources is significantly reduced, which makes the system platform obviously able to support more workloads to maintain an acceptable level of quality of service.
【技术实现步骤摘要】
一种基于资源共享自适应配置的GPU虚拟化QoS控制系统及方法
本专利技术云系统架构的虚拟化
,尤其涉及到一种基于资源共享自适应配置的GPU虚拟化QoS控制系统及方法。
技术介绍
目前,基于虚拟化技术的云系统架构已经广泛应用于商业,科研和教育等各个领域。这种实际应用领域中的广泛适用性基本建立在云平台架构的固有特性之上,这些特性包括任务处理方面的高度并发性和资源共享方面的灵活性。很明显,上述所有特性都基于虚拟化技术中包含的资源调度,共享和隔离功能。但是,目前可以成熟地应用上述这些功能,并且避免性能下降和硬件限制的计算资源种类仍然非常有限,而大量针对特定应用程序或用途的工作负载除了它们之外往往还具有特定类型的额外资源需求。例如,对于涉及图形计算或大规模浮点数计算的工作负载,需要将GPU资源用于其实现需求,因为GPU可以利用其高并行浮点数计算能力大大加快这些工作负载的计算速度。然而,如果目标是对虚拟化GPU进行资源共享,那么就会出现这样的挑战:如果不修改设备驱动程序,大部分困难都无法解决,但大多数实用的GPU产品不提供开源驱动程序、硬件规格或通信协议,这使得在GPU ...
【技术保护点】
1.一种基于资源共享自适应配置的GPU虚拟化QoS的控制系统,所述控制系统构建在基于Xen平台的虚拟化云架构之上,其特征在于,包括:监控模块、控制模块和调度模块,三个模块分别实现并插入到Xen平台的不同层级和组件中,所述监控模块收集从客户虚拟机和物理机内核上开放的接口记录的运行时数据;所述控制模块接收汇总数据,并根据运行时状态计算对资源分配的调整来趋近QoS目标,所述调度模块获取控制模块提交的调整指令,然后在调整后的资源容量限制下,对客户虚拟机进行上下文切换的调度,在QoS约束下在所有虚拟化云计算工作负载之间进行GPU资源容量共享和分配。
【技术特征摘要】
1.一种基于资源共享自适应配置的GPU虚拟化QoS的控制系统,所述控制系统构建在基于Xen平台的虚拟化云架构之上,其特征在于,包括:监控模块、控制模块和调度模块,三个模块分别实现并插入到Xen平台的不同层级和组件中,所述监控模块收集从客户虚拟机和物理机内核上开放的接口记录的运行时数据;所述控制模块接收汇总数据,并根据运行时状态计算对资源分配的调整来趋近QoS目标,所述调度模块获取控制模块提交的调整指令,然后在调整后的资源容量限制下,对客户虚拟机进行上下文切换的调度,在QoS约束下在所有虚拟化云计算工作负载之间进行GPU资源容量共享和分配。2.根据权利要求1所述的一种基于资源共享自适应配置的GPU虚拟化QoS的控制系统,其特征在于,所述调度模块包含在内核驱动模块之中,直接操纵所有的虚拟GPU设备,实现时间槽分配和上下文切换。3.根据权利要求2所述的一种基于资源共享自适应配置的GPU虚拟化QoS的控制系统,其特征在于,所述内核驱动模块与用户空间之间添加一个接口来接收GPU容量配置,通过该接口,内核中的调度进程响应来自控制模块的对于GPU容量限制进行改变的请求,当接收到请求时,调度过程不需要立即响应配置变化,容量参数将每次在确定的时间间隔后进行更新,来平衡响应速度和额外开销。4.根据权利要求1所述的一种基于资源共享自适应配置的GPU虚拟化QoS的控制系统,其特征在于,...
【专利技术属性】
技术研发人员:管海兵,卢秋旻,姚建国,
申请(专利权)人:上海交通大学,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。