优化可扩展GPU虚拟化的系统、装置和方法制造方法及图纸

技术编号：18237572 阅读：78 留言：0更新日期：2018-06-17 00:42

本发明专利技术公开了一种优化可扩展GPU虚拟化的方法，包括：为每个vGPU提供私有影子图形转换表GTT；连同上下文切换将vGPU的私有影子GTT复制到物理GTT，其中所述私有影子GTT允许vGPU共享重叠范围的全局图形存储器空间。 1

System, device and method for optimizing extensible GPU virtualization

The present invention discloses a method for optimizing extensible GPU virtualization, including: providing private shadow graphics conversion table GTT for each vGPU; copying the private shadow GTT of vGPU to physical GTT with context switching, in which the private shadow GTT allows vGPU to share a global graphical memory space of overlapping range. One

全部详细技术资料下载

【技术实现步骤摘要】
优化可扩展GPU虚拟化的系统、装置和方法
本专利技术一般涉及计算机处理器，尤其涉及优化可扩展GPU虚拟化的系统、装置和方法。
技术介绍
图形处理单元(GPU)在云计算中发挥着不可替代的作用，因为GPU能高效地加速诸如2D和3D渲染之类的某些工作负载的计算。随着越来越多的GPU密集型工作负载被部署在云端，云服务器提供商引入一种新的计算范式，称为GPU云，以满足对GPU资源的高需求，例如，亚马逊EC2GPU实例和阿里云GPU服务器。作为GPU云的关键实现技术中的一种，GPU虚拟化旨在为多个实例提供高性能的灵活且可扩展(scalable)的GPU资源。为了实现这一具有挑战性的目标，已经引入若干GPU虚拟化解决方案，例如GPUvm和gVirt。gVirt也称为GVT-g，是一种完全虚拟化解决方案，对英特尔图形处理器具有适中的直通支持。在每个虚拟机VM中，利用本机图形驱动器运行，维持虚拟GPU(vGPU)实例以提供直接分配的性能关键资源，因为在性能关键路径上没有虚拟机监控程序(hypervisor)干预。因此，其在性能、特性和共享能力之间优化资源。对于虚拟化方案，可扩展性是一种不可替代的特性，它通过在云服务器上主存密集的VM实例来确保高资源利用率。尽管gVirt成功实施GPU虚拟化，然而它遭受放大vGPU实例的数量的问题。当前版本的gVirt仅支持一个物理英特尔GPU上3个虚拟机vGPU实例，这将虚拟机VM实例的数量限制到3个。相反，CPU虚拟化技术(例如，Xen4.6虚拟机VM支持高达256个vCPU)被充分实现，以便开发其潜能。GPU与类似CPU之类的其它资源的...
优化可扩展GPU虚拟化的系统、装置和方法

【技术保护点】
1.一种优化可扩展GPU虚拟化的方法，包括：

【技术特征摘要】
1.一种优化可扩展GPU虚拟化的方法，包括：为每个vGPU提供私有影子图形转换表GTT；连同上下文切换将vGPU的私有影子GTT复制到物理GTT，其中所述私有影子GTT允许vGPU共享重叠范围的全局图形存储器空间。2.如权利要求1所述的方法，其特征在于，所述全局图形存储器空间包括全局图形存储器空间的低地址部分和全局图形存储器空间的高地址部分，所述方法还包括：通过使用阶梯映射和栅栏寄存器存储器空间池在所有的vGPU之间共享全局图形存储器空间的低地址部分；将所述全局图形存储器空间的高地址部分分成若干区片；以及将一个或多个vGPU部署在一个区片中。3.如权利要求1所述的方法，其特征在于，还包括：不对空闲vGPU实例进行上下文切换；以及不从空闲vGPU的私有影子GTT向物理GTT复制条目。4.如权利要求1所述的方法，其特征在于，还包括：将所述全局图形存储器空间的高地址部分分成若干子区片，每个vGPU占据数个相邻的子区片。5.如权利要求4所述的方法，其特征在于，第一vGPU占据第一多个连续子区片，而第二vGPU占据第二多个连续子区片，所述第一多个连续子区片与第二多个连续子区片相同、至少部分重叠、相邻或分离。6.如权利要求2所述的方法，其特征在于，还包括：根据历史记录投票预测下一时间片哪个VM即将运行；以及如果调度序列中相邻的vGPU未被部署在同一区片中，则在前一vGPU仍占据GPU的同时，将下一vGPU的影子GTT复制到其对应的区片中，以缩短上下文切换时间。7.如权利要求2所述的方法，其特征在于，还包括：安排多个区片上的vGPU的上下文切换序列。8.如权利要求7所述的方法，其特征在于，安排多个区片上的vGPU的上下文切换序列还包括：a)在所有的区片中找出具有最大数量vGPU的第一区片；b)从第一区片弹出一个vGPU；c)在剩余的区片中找出具有最大数量vGPU的第二区片；d)从第二区片中弹出一个vGPU；e)将弹出的vGPU插入OutputVmList，所述OutputVmList指示一个循环的调度序列；f)返回步骤a)并重复步骤a)至步骤e)。9.如权利要求8所述的方法，其特征在于，安排多个区片上的vGPU的上下文切换序列还包括：如果所有的其它区片均先弹光它们的vGPU而最后一个区片中的一些vGPU未被弹出，则将最后一个区片中的所有剩余的VM插入OutputVmList。10.一种优化可扩展GPU虚拟化的装置，包括：一个或多个虚拟机...

【专利技术属性】
技术研发人员：马嘉诚，管海兵，戚正伟，陈勇彪，
申请(专利权)人：上海交通大学，
类型：发明
国别省市：上海,31

全部详细技术资料下载我是这个专利的主人