基于虚拟机的GPU集群管理系统技术方案

技术编号：7501101 阅读：382 留言：0更新日期：2012-07-11 01:36

本发明专利技术提供了一种基于虚拟机的GPU集群管理系统，包括集群管理节点和多个GPU集群节点，GPU集群节点又包括一个管理域和多个虚拟机。各虚拟机接收用户的CUDA作业，将其转发给集群管理节点，集群管理节点根据CUDA作业要求、GPS的参数信息以及虚拟机的当前作业队列信息指定合适的虚拟机运行作业；被指定的虚拟机运行作业过程中，拦截作业务中的特权指令，将其传送给管理域，管理域通过GPU驱动操作GPU运行特权指令，返回运行结果给对应的虚拟机以协助虚拟机的GUDA作业运行。本发明专利技术提供了先进的集群架构，支持虚拟桌面用户通过客户端提交GPU任务。该就能架构符合一系列的功能要求，包括网络透明性，易操作性和可扩展性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及集群管理的
，更具体地涉及在虚拟桌面平台下提供支持GPU 计算任务运行和多个GPU服务器组成的GPU集群计算资源的调度和管理的系统。
技术介绍
当前远程桌面技术受到人们的追捧，当某台计算机开启了远程桌面连接功能后我们就可以在网络的另一端控制这台计算机了，通过远程桌面功能我们可以实时的操作这台计算机，在上面运行各种应用程序，所有的一切都好像是直接在该计算机上操作一样。集群是使用多个计算机，如典型的个人计算机或服务器，通过网络互联，来组成一个对用户来说单一的高可用性的系统。集群计算能够被用来实现负载均衡，当自己的计算机不满足某计算作业的要求时，集群系统可以把作业提交到支持该作业的计算节点上，而对计算机的使用者透明。从而，对外界来说，集群就像是一个唯一的系统。当前高校和研究院都广泛简历集群系统进行科学研究。但是目前没有基于虚拟机的GPU集群系统，不仅使集群支持GPU计算，还满足虚拟机用户进行GPU计算的支持。同时传统的集群调度算法使 GPU效率低下，不利于GPU充分发挥强劲的计算能力。
技术实现思路
本专利技术的目的在于提供一种基于虚拟机的GPU集群管理系统，该系统具有网络透明性和可扩展性。如图1和2所示，本专利技术系统包括一个集群管理节点和多个与其相接的GPU集群节点。GPU集群节点包括一个管理域和多个虚拟机。虚拟机提供用户操作接口以接收用户的CUDA作业，拦截任务中的特权指令，将其传送给管理域。管理域通过GPU驱动操作GPU 执行特权指令，返回执行结果给对应的虚拟机。虚拟机包括GPU信息收集模块1. 1、集群管理模块2. 1和vCUDA库拦...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员：金海，廖小飞，梁东，
申请(专利权)人：华中科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人