本发明专利技术提供一种基于虚拟机快照的内存页去重方法及装置,应用于虚拟机快照系统,所述方法包括:宿主机根据各虚拟机对应的内存页的内容,将各虚拟机对应的内存页中内容相同的内存页进行合并处理;将所述合并处理后的各虚拟机对应的内存页发送给存储系统。可以改善虚拟机快照技术中的快照备份数据存在占用大量磁盘空间的问题,同时可以减少快照备份时间。
【技术实现步骤摘要】
本专利技术涉及计算机
,尤其涉及一种基于虚拟机快照的内存页去重方法及>J-U ρ α装直。
技术介绍
虚拟机快照技术是用来实现对一个虚拟机运行状态的记录,并在任意时刻可以将虚拟机回滚到记录时的虚拟机运行状态;这样在虚拟机因故障而失效时,可以从快照点恢 复到之前所记录的正常运行的状态,从而实现虚拟机的备份。通常,虚拟机运行状态包括网络状态、内存状态、CPU状态、及磁盘状态等。其中,内存状态需要保存的内存页的数据量较大,从而使得快照备份数据较大。例如,对于虚拟机集群(8台IG内存的虚拟机)快照,需要保存的内存状态则为集群中虚拟机的内存之和(8G)。进一步,快照的时间间隔通常为几分钟,这种高频度的快照又进一步增加了快照备份数据量。例如以10分钟的快照时间间隔计算,每天需要144次快照,需要占据IT的磁盘空间。因此,在虚拟机快照技术中,数据量较大的快照备份数据不仅占用大量的磁盘空间,而且增加快照备份时间。
技术实现思路
本专利技术提供一种基于虚拟机快照的内存页去重方法及装置,用于解决虚拟机快照技术中的快照备份数据存在占用大量磁盘空间的问题。本专利技术的第一个方面是提供一种基于虚拟机快照的内存页去重方法,包括宿主机根据各虚拟机对应的内存页的内容,将各虚拟机对应的内存页中内容相同的内存页进行合并处理;将所述合并处理后的各虚拟机对应的内存页发送给存储系统。本专利技术的第二个方面是提供一种基于虚拟机快照的内存页去重方法,应用于虚拟机快照系统,包括存储系统分别接收各宿主机发送的内存页,所述各宿主机发送的内存页是所述各宿主机将各虚拟机对应的内存页中内容相同的内存页进行合并处理后得到的;所述存储系统根据各宿主机发送的内存页的内容,将各宿主机发送的内存页中内容相同的内存页进行合并处理;所述存储系统保存所述合并处理后的内存页。本专利技术的第三个方面是提供一种宿主机,运行有多个虚拟机,包括第一处理模块,用于根据所述宿主机上运行的多个虚拟机对应的内存页的内容,将所述多个虚拟机对应的内存页中内容相同的内存页进行合并处理;发送模块,用于将所述合并处理后的各虚拟机对应的内存页发送给存储系统。本专利技术的第四个方面是提供一种存储系统,应用于虚拟机快照系统,包括接收模块,用于分别接收各宿主机发送的内存页,所述各宿主机发送的内存页是所述各宿主机将各虚拟机对应的内存页中内容相同的内存页进行合并处理后得到的;第二处理模块,用于根据各宿主机发送的内存页的内容,将各宿主机发送的内存页中内容相同的内存页进行合并处理;保存模块,用于保存所述合并处理后的内存页。本专利技术的第五个方面是提供一种虚拟机快照系统,包括上述宿主机和存储系统。本专利技术实施例通过宿主机根据各虚拟机对应的内存页的内容,将各虚拟机对应的内存页中内容相同的内存页进行合并处理;将所述合并处理后的各虚拟机对应的内存页发送给存储系统,可以减小宿主机发送给存储系统的内存页的数据量,从而可以改善虚拟机快照技术中的快照备份数据存在占用大量磁盘空间的问题;同时通过减小宿主机发送给存储系统的内存页的数据量,可以减小宿主机和存储系统之间的网络开销,也可以减小快照备份时间。附图说明图1为本专利技术一实施例提供的基于虚拟机快照的内存页去重方法的流程示意图;图2为本专利技术另一实施例提供的基于虚拟机快照的内存页去重方法的流程示意图;图3为本专利技术另一实施例提供的宿主机的结构示意图;图4为本专利技术另一实施例提供的存储系统的结构示意图;图5为图1-图4所示实施例应用的虚拟机快照系统的架构图;图6为图1-图4所示实施例应用的哈希结构表示意图;图7为图1-图4所示实施例应用的哈希结构表建立的过程示意图;图8为图1-图4所示实施例应用的哈希结构表更新的过程示意图;图9为图1-图4所示实施例应用的数据包格式的示意图。具体实施例方式图1为本专利技术一实施例提供的基于虚拟机快照的内存页去重方法的流程示意图;图5为图1-图4所示实施例应用的虚拟机快照系统的架构图,如图1和图5所示,本实施例的基于虚拟机快照的内存页去重方法具体包括101、宿主机根据各虚拟机对应的内存页的内容,将各虚拟机对应的内存页中内容相同的内存页进行合并处理。通常,虚拟机集群中各虚拟机大多运行同样的操作系统,承载类似的应用,使得各虚拟机内存中有大量的数据是相同的,图5所示的虚拟机快照系统的架构图是针对虚拟机集群的快照,以虚拟机集群为单位进行数据的备份,为了减少虚拟机集群的快照过程中存在的大量相同的内存数据,减少快照备份时间,本专利技术实施例中,每一宿主机根据该宿主机中各虚拟机对应的内存页的内容,将内容相同的内存页进行合并处理,具体实现时例如,图5所示,第一宿主机中有虚拟机VMl和虚拟机VM2,假设VMl和VM2中各有4个内存页,第一宿主机获取虚拟机VMl中的4个内存页和虚拟机VM2中的4个内存页;根据虚拟机VMl和虚拟机VM2中各自对应的4个内存页对应的内容,确定VMl中的内存页I和内存页3的内容与VM2中的内存页3的内容相同,该宿主机可以将VMl中的内存页I和内存页3以及VM2中的内存页3进行合并处理,即宿主机可以在VMl中的内存页I和内存页3以及VM2中的内存页3中任选其中的一个内存页发送给存储系统,不需要将VMl中的内存页I和内存页3以及VM2中的内存页3都发送给存储系统。需要说明的是,在实际应用中,各虚拟机的内存页数量较多,假设虚拟机内存为1G,则该虚拟机包括256K内存页,其中,K是计算机中用来表达数量的单位,lK=1024bit,如果采用逐页比较的方式比较耗时。在本专利技术的一个实施方式中,为了提高内存页内容比较的效率,采用哈希Hash算法计算每个内存页面的Hash值,根据计算得到的各内存页对应的哈希Hash值,构建各内存页对应的红黑树或链表;其中,将哈希Hash值相同的各内存页对应的页信息插入到所述哈希Hash值在所述红黑树或链表上对应的哈希Hash节点中;具体实现时图6为图1-图4所示实施例应用的哈希结构表的示意图,如图6所示,哈希结构表包括桶(bucket)、哈希节点(hash node)、页信息(page item);其中,bucket主要用来实现对内存页的快速索弓I, bucket包括哈希桶(hashbucket)和地址桶(addr bucket);其中,addr bucket用来对页信息page item进行索引,而hash bucket根据页信息page item中的hash值来构建红黑树或链表。其中,每个hash bucket中存储了一组相似Hash值的页,例如,一个Hash值可以用32比特来表示,假设将Hash值的前20个比特相同的Hash值作为相似Hash值,本实施例中,可以将相似Hash值插入到同一个hash bucket中,用来提高对内存页的索引效率;假设哈希结构表由IM元素组成hash bucket,其中每一个hash bucket为Hash值的前20个bit值,因此,每个hash bucket最多可以表达4096 ((2~ 12)个hash值不同的hash node。 其中,hash node可以以链表或者红黑树的形式挂载在哈希结构表上,如果每个bucket数组元素中的hash node数目小于3,则以链表形式挂载在哈希结构表上;如果每个bucket数组本文档来自技高网...
【技术保护点】
一种基于虚拟机快照的内存页去重方法,其特征在于,包括:宿主机根据各虚拟机对应的内存页的内容,将各虚拟机对应的内存页中内容相同的内存页进行合并处理;将所述合并处理后的各虚拟机对应的内存页发送给存储系统。
【技术特征摘要】
1.一种基于虚拟机快照的内存页去重方法,其特征在于,包括 宿主机根据各虚拟机对应的内存页的内容,将各虚拟机对应的内存页中内容相同的内存页进行合并处理; 将所述合并处理后的各虚拟机对应的内存页发送给存储系统。2.根据权利要求1所述的方法,其特征在于,宿主机根据各虚拟机对应的内存页的内容,将各虚拟机对应的内存页中内容相同的内存页进行合并处理之前,具体包括 所述宿主机获取各虚拟机对应的内存页的内容及页信息; 根据各内存页的内容,利用哈希Hash算法,计算各内存页对应的Hash值; 根据计算得到的各内存页对应的Hash值,构建与各内存页对应的哈希结构表,所述哈希结构表包括红黑树和/或链表; 将各内存页的页信息插入到所述哈希结构表中与各内存页的Hash值对应的Hash节点的页信息列表中。3.根据权利要求2所述的方法,其特征在于,将各虚拟机对应的内存页中内容相同的内存页进行合并处理,具体包括 根据预设的数据包格式,所述数据包格式包括至少一个页内容表项和与各页内容表项对应的页信息表项,将所述哈希结构表中各Hash节点对应的内存页的内容分别封装到各页内容表项中,将所述哈希结构表中各Hash节点对应的内存页的页信息列表中包含的各页信息分别封装到对应的页信息表项中。4.一种基于虚拟机快照的内存页去重方法,其特征在于,包括 存储系统分别接收各宿主机发送的内存页,所述各宿主机发送的内存页是所述各宿主机将各虚拟机对应的内存页中内容相同的内存页进行合并处理后得到的; 所述存储系统根据各宿主机发送的内存页的内容,将各宿主机发送的内存页中内容相同的内存页进行合并处理; 所述存储系统保存所述合并处理后的内存页。5.根据权利要求4所述的方法,其特征在于,所述存储系统根据各宿主机发送的内存页的内容,将各宿主机发送的内存页中内容相同的内存页进行合并处理之前,包括 所述存储系统根据预设的数据包格式解析各宿主机发送的内存页,分别获取各宿主机发送的...
【专利技术属性】
技术研发人员:李博,崔磊,李建欣,沃天宇,
申请(专利权)人:北京航空航天大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。