一种GPU实时迁移方法、装置及电子设备制造方法及图纸

技术编号:33375898 阅读:31 留言:0更新日期:2022-05-11 22:43
本发明专利技术公开了一种GPU实时迁移方法、装置及电子设备,其中GPU实时迁移方法,包括:更新步骤:更新内存脏页表;检测步骤:检测更新后的所述内存脏页表中的内存页是否为脏页;传输步骤:传输所述脏页的页面数据;迭代所述更新步骤、所述检测步骤和所述传输步骤,在所述脏页的传输时间达到预设标准之后,继续更新所述内存脏页表,得到最终的内存脏页表;检测所述最终的内存脏页表中的内存页是否为脏页,并传输所述最终的内存脏页表中的脏页;由此可以通过多轮迭代传输内存页中的脏页,以最小化最终脏页表中的传输数量,即采用Pre

【技术实现步骤摘要】
一种GPU实时迁移方法、装置及电子设备


[0001]本专利技术涉及虚拟化和云计算技术
,具体涉及一种GPU实时迁移方法、装置及电子设备。

技术介绍

[0002]实时迁移,也叫热迁移,是虚拟化和云计算中使用最广泛的关键特性之一,可以将虚拟机从一个主机迁移到另一个主机,而不会影响或通知虚拟机的用户。实时迁移的有效性是通过所需的服务停机时间来衡量的,服务停机时间是迁移过程中虚拟机必须停止的时间。服务停机主要是由于虚拟机的内存传输造成的。
[0003]对于IaaS(Infrastructure as a Service,基础设施及服务)云平台供应商来说,虚拟机的实时迁移至关重要。通过虚拟机实时迁移,IaaS云平台供应商可以:

提供HA(High Available,高可用)虚拟机实例;

简化系统的维护管理;

提高系统的负载均衡;

增强系统的错误容忍度;

优化系统的电源管理,为节约能做出贡献。GPU实时迁移是虚拟机迁移中的核心技术之一,它可以为提供GPU虚拟化实例的IaaS供应商带来很多好处。通过支持GPU实时迁移,云供应商可以为支持GPU的虚拟机提供上述所有特性。

技术实现思路

[0004]有鉴于此,本专利技术实施例提供了一种GPU实时迁移方法、装置及电子设备。
[0005]根据第一方面,本专利技术实施例提供了一种GPU实时迁移方法,包括:更新步骤:更新内存脏页表;检测步骤:检测更新后的所述内存脏页表中的内存页是否为脏页;传输步骤:传输所述脏页的页面数据;迭代所述更新步骤、所述检测步骤和所述传输步骤,在所述脏页的传输时间达到预设标准之后,继续更新所述内存脏页表,得到最终的内存脏页表;检测所述最终的内存脏页表中的内存页是否为脏页,并传输所述最终的内存脏页表中的脏页。
[0006]本专利技术实施例的GPU实时迁移方法,通过扫描内存访问,得到内存脏页表;检测所述内存脏页表中的内存页是否为脏页;传输所述脏页的页面数据;在所述脏页的传输时间达到预设标准之后,继续扫描内存访问,得到最终脏页表;检测所述最终脏页表中的内存页是否为脏页,传输所述最终脏页表中的脏页;由此可以通过多轮迭代传输内存页中的脏页,以最小化最终脏页表中的传输数量,即采用采用Pre

Copy预拷贝机制实现GPU的实时迁移。
[0007]结合第一方面,在第一方面第一实施方式中,所述检测更新后的所述内存脏页表中的内存页是否为脏页内存脏页表包括:计算所述更新后的内存脏页表中内存页的当前哈希值,并保存;获取更新前所述内存脏页表中内存页的上一哈希值;针对同一内存页,判断该内存页的当前哈希值与上一哈希值是否相同;当所述当前哈希值与所述上一哈希值不同时,判定该内存页为脏页。
[0008]结合第一方面,在第一方面第二实施方式中,在更新内存脏页表之前,还包括:扫描GPU显存访问,构建内存脏页表;计算所述内存脏页表中所有内存页的哈希值,并保存;传输所述内存脏页表中的所有内存页。
[0009]结合第一方面,在第一方面第三实施方式中,在更新内存脏页表之后,还包括:保存所述更新后的内存脏页表中内存页的采样数据,得到采样记录。
[0010]结合第一方面第三实施方式,在第一方面第四实施方式中,所述检测所述最终的内存脏页表中的内存页是否为脏页包括:获取所述最终的内存脏页表中内存页的采样字节;针对同一内存页,判断所述采样记录中是否包含该内存页的采样数据,当所述采样记录中不包含该内存页的采样数据时,判定该内存页为脏页。
[0011]结合第一方面第四实施方式,在第一方面第五实施方式中,GPU实时迁移方法还包括:当所述采样记录中包含该内存页的采样数据时,判断该内存页的采样字节与采样数据是否相同;当所述内存页的采样字节与采样数据不同时,判定该内存页为脏页;当所述内存页的采样字节与采样数据相同时,计算该内存页的当前哈希值并获取该内存页的上一哈希值;当所述当前哈希值与所述上一哈希值不同时,判定该内存页为脏页。
[0012]结合第一方面,在第一方面第六实施方式中,所述检测步骤与所述传输步骤并行进行。
[0013]根据第二方面,本专利技术实施例提供了一种GPU实时迁移装置,包括扫描模块、检测模块和传输模块;所述扫描模块,用于更新内存脏页表;所述检验模块,用于检测更新后的所述内存脏页表中的内存页是否为脏页;所述传输模块,用于传输所述脏页的页面数据;在所述脏页的传输时间达到预设标准之后,所述扫描模块还用于继续更新所述内存脏页表,得到最终的内存脏页表;所述检验模块,还用于检测所述最终的内存脏页表中的内存页是否为脏页;所述传输模块,还用于传输所述最终的内存脏页表中的脏页。
[0014]根据第三方面,本专利技术实施例还提供了一种电子设备,包括存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行第一方面或者第一方面的任意一种实施方式中所述的GPU实时迁移方法。
[0015]根据第四方面,本专利技术实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行第一方面或者第一方面的任意一种实施方式中所述的GPU实时迁移方法。
附图说明
[0016]通过参考附图会更加清楚的理解本专利技术的特征和优点,附图是示意性的而不应理解为对本专利技术进行任何限制,在附图中:
[0017]图1为本专利技术实施例1中GPU实时迁移方法的流程示意图;
[0018]图2为示例1云主机迁移中GPU实时迁移的架构图;
[0019]图3为vGPU迁移工作流;
[0020]图4为哈希校验工作流;
[0021]图5为本专利技术实施例2中GPU实时迁移装置的结构示意图。
具体实施方式
[0022]为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是
本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0023]实施例1
[0024]本专利技术实施例1提供了一种GPU实时迁移方法。该方法采用Pre

Copy预拷贝机制,结合基于哈希的软件脏页验证技术,使用采样过滤优化策略,只发送脏页,加快vGPU迁移速度,实现vGPU实时迁移,克服商用GPU的限制。
[0025]Pre

Copy方法的关键思想是最小化停机期间传输的内存页面数量。该方法将迁移过程分为两个阶段:

预拷贝阶段,

停止和复制阶段。预拷贝阶段是指在虚拟机继续在源上运行时复制数据的过程。在这一阶段,通过多轮迭代传输内存脏页,以最小化停止和复制阶段的传输数量。停止本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种GPU实时迁移方法,其特征在于,包括:更新步骤:更新内存脏页表;检测步骤:检测更新后的所述内存脏页表中的内存页是否为脏页;传输步骤:传输所述脏页的页面数据;迭代所述更新步骤、所述检测步骤和所述传输步骤,在所述脏页的传输时间达到预设标准之后,继续更新所述内存脏页表,得到最终的内存脏页表;检测所述最终的内存脏页表中的内存页是否为脏页,并传输所述最终的内存脏页表中的脏页。2.根据权利要求1所述的方法,其特征在于,所述检测更新后的所述内存脏页表中的内存页是否为脏页内存脏页表包括:计算所述更新后的内存脏页表中内存页的当前哈希值,并保存;获取更新前所述内存脏页表中内存页的上一哈希值;针对同一内存页,判断该内存页的当前哈希值与上一哈希值是否相同;当所述当前哈希值与所述上一哈希值不同时,判定该内存页为脏页。3.根据权利要求1所述的方法,其特征在于,在更新内存脏页表之前,还包括:扫描GPU显存访问,构建内存脏页表;计算所述内存脏页表中所有内存页的哈希值,并保存;传输所述内存脏页表中的所有内存页。4.根据权利要求1所述的方法,其特征在于,在更新内存脏页表之后,还包括:保存所述更新后的内存脏页表中内存页的采样数据,得到采样记录。5.根据权利要求4所述的方法,其特征在于,所述检测所述最终的内存脏页表中的内存页是否为脏页包括:获取所述最终的内存脏页表中内存页的采样字节;针对同一内存页,判断所述采样记录中是否包含该内存页的采样数据,当所述采样记录中不包含该内存页的采样数据时,判定该内存页为...

【专利技术属性】
技术研发人员:凌徐艾天翔李光辉霍欣莉果红艳王庆兆
申请(专利权)人:天翼云科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1