数据处理方法和虚拟机管理平台技术

技术编号:8626015 阅读:177 留言:0更新日期:2013-04-25 23:07
本发明专利技术提供一种数据处理方法和虚拟机管理平台,通过扫描物理硬盘上存储的、与各个虚拟硬盘对应的数据块,获取各个虚拟硬盘之间数据内容出现重复的重复数据块,并在重复数据记录表中存储所有重复数据块的标识信息和存储信息的对应关系,当任一重复数据块从物理硬盘中存储到内存中时,根据内存地址更新重复数据记录表中与重复数据块的所有标识信息对应的存储信息,以便在读取数据块时,根据所需读取数据块的标识信息获取对应的存储信息,并根据存储信息从内存中读取数据块。实现了多台虚拟机在访问位于物理硬盘不同位置的相同数据内容时,减少了对物理硬盘的反复访问,提高了对虚拟机的读请求响应速度,并且延长了硬盘的使用寿命。

【技术实现步骤摘要】

本专利技术实施例涉及通信
,尤其涉及一种数据处理方法和虚拟机管理平台
技术介绍
虚拟化技术是云计算领域的关键技术之一,其主要原理是将一台物理机的物理资源虚拟化为多个可以独立运行操作系统的虚拟机,每个虚拟机都可以独立实现物理机的功能,互不干扰,虚拟机使用过程与物理机一致,可以认为虚拟机是物理机的一种抽象化形式。图1是现有虚拟化技术的结构示意图,如图1所示,硬件平台101上的各种物理资源(包括中央处理器102、内存103、硬盘104、网卡105)被虚拟机管理平台110抽象为多个虚拟机(Virtual Machine,VM)130,其中硬盘104可以位于本地或远端。虚拟资源的功能与真实物理资源的作用完全一致,用户在虚拟机中对虚拟资源的操作与物理机完全一致。在不同的虚拟机中可以安装独立的操作系统132,以及一个或多个应用程序131。虚拟机管理平台110负责将物理硬盘104抽象为各个独立的虚拟硬盘124,供不同的虚拟机130使用,所有虚拟机130表面上使用的是各个独立的虚拟硬盘124,实际上则是使用的一个或多个物理硬盘104中的不同空间。当某个虚拟机104访问其对应的虚拟硬盘124时,虚拟机管理平台110将对虚拟机硬盘124的请求映射为对物理硬盘104不同空间的请求,从而实现不同虚拟机130拥有各自独立的虚拟硬盘124,互不干扰。在虚拟化技术中由于多个虚拟机共享同一个物理硬盘,这就意味着在同一时间可能有一个或几个,甚至几十个虚拟机在访问各自的虚拟机硬盘,对应到物理硬盘上,则是在访问同一个物理硬盘。物理硬盘有多项技术指标,其中最重要的一项指标是(Input/OutputOperations Per Second, I OPS),即每秒进行读写(1/0)操作的次数,该值越大,表示硬盘响应请求的速度越快、延迟越小。在这项指标中,读操作相比于写操作,更影响虚拟机性能。在硬盘发展的当前阶段,其所能提供的IOPS数值是有限的。当物理硬盘被一个或几个虚拟机同时访问时,不会有太大的性能瓶颈,用户感受不到明显的延迟。但是,当物理硬盘被几十个用户在同时访问时,则会有明显的延迟产生,这极大影响了虚拟机性能。例如,当早上大量用户同时进行开机操作时,需要同时访问硬盘获取系统数据,这时就会发现开机速度有明显的降低,这种现象称为“启动风暴”;又如,当大量用户进行杀毒操作时,也会出现明显的延迟,可以称之为“杀毒风暴”。
技术实现思路
针对现有技术的上述缺陷,本专利技术实施例提供一种数据处理方法和虚拟机管理平台。第一方面,本专利技术一方面提供一种数据处理方法,包括扫描物理硬盘上存储的、与各个虚拟硬盘对应的数据块,获取各个虚拟硬盘之间数据块内容相同的各重复数据块组,并在重复数据记录表中存储各重复数据块组中各数据块的标识彳目息和存储彳目息的对应关系;当各重复数据块组中任一数据块从所述物理硬盘中存储到内存中时,根据内存地址更新所述重复数据记录表中所述数据块所在的重复数据块组中的所有存储信息,以便在读取数据块时,根据所需读取数据块的标识信息获取对应的存储信息,并根据所述存储信息从所述内存中读取所述数据块。在第一种可能的实现方式中,所述获取各个虚拟硬盘之间数据块内容相同的各重复数据块组包括采用哈希算法对每个数据块的数据内容进行计算获取哈希值;比较每个数据块的哈希值,获取各个虚拟硬盘之间哈希值相同的各重复数据块组。结合第一方面或第一方面的第一种可能的实现方式,在第二种可能的实现方式中,还包括接收携带标识信息的数据块写入请求;根据所述标识信息查询所述重复数据记录表,若判断获知所述重复数据记录表中存储有与所述标识信息对应的存储信息,则根据所述标识信息将所述数据块写入所述物理硬盘中,并删除所述重复数据记录表中与所述数据块对应的存储信息。 结合第一方面或第一方面的第一种可能的实现方式,在第三种可能的实现方式中,所述根据所需读取数据块的标识信息获取对应的存储信息,并根据所述存储信息从所述内存中读取所述数据块包括接收携带标识信息的数据块读取请求;根据所述标识信息查询所述重复数据记录表,若判断获知所述重复数据记录表中存储有与所述标识信息对应的存储信息,且所述存储信息标识所述数据块存储在所述内存中,则根据所述存储信息从所述内存中读取所述数据块。结合第一方面的第三种可能的实现方式,在第四种可能的实现方式中,还包括若所述存储信息标识所述数据块存储在所述物理硬盘中,则根据所述标识信息从所述物理硬盘存储中读取所述数据块,并将所述数据块存储到所述内存中,并更新所述重复数据记录表中与所述数据块对应的存储信息。第二方面,本专利技术一方面提供一种虚拟机管理平台,包括获取模块,用于扫描物理硬盘上存储的、与各个虚拟硬盘对应的数据块,获取各个虚拟硬盘之间数据块内容相同的各重复数据块组,并在重复数据记录表中存储各重复数据块组中各数据块的标识信息和存储信息的对应关系;处理模块,用于当各重复数据块组中任一数据块从所述物理硬盘中存储到内存中时,根据内存地址更新所述重复数据记录表中所述数据块所在的重复数据块组中的所有存储信息;读取模块,用于在读取数据块时,根据所需读取数据块的标识信息获取对应的存储信息,并根据所述存储信息从所述内存中读取所述数据块。在第一种可能的实现方式中,所述获取模块具体用于采用哈希算法对每个数据块的数据内容进行计算获取哈希值;比较每个数据块的哈希值,获取各个虚拟硬盘之间哈希值相同的各重复数据块组。结合第二方面或第二方面的第一种可能的实现方式,在第二种可能的实现方式中,还包括写入模块,用于接收携带标识信息的数据块写入请求;根据所述标识信息查询所述重复数据记录表,若判断获知所述重复数据记录表中存储有与所述标识信息对应的存储信息,则根据所述标识信息将所述数据块写入所述物理硬盘中,并删除所述重复数据记录表中与所述数据块对应的存储信息。结合第二方面或第二方面的第一种可能的实现方式,在第三种可能的实现方式中,所述读取模块具体用于接收携带标识信息的数据块读取请求;根据所述标识信息查询所述重复数据记录表,若判断获知所述重复数据记录表中存储有与所述标识信息对应的存储信息,且所述存储信息标识所述数据块存储在所述内存中,则根据所述存储信息从所述内存中读取所述数据块。结合第二方面的第三种可能的实现方式,在第四种可能的实现方式中,所述读取模块还用于若所述存储信息标识所述数据块存储在所述物理硬盘中,则根据所述标识信息从所述物理硬盘存储中读取所述数据块,并将所述数据块存储到所述内存中,并更新所述重复数据记录表中与所述数据块对应的存储信息。本专利技术实施例提供的数据处理方法和虚拟机管理平台,通过扫描物理硬盘上存储的、与各个虚拟硬盘对应的数据块,获取各个虚拟硬盘之间数据内容出现重复的重复数据块,并在重复数据记录表中存储所有重复数据块的标识信息和存储信息的对应关系,当任一重复数据块从物理硬盘中存储到内存中时,根据内存地址更新重复数据记录表中与重复数据块相关的所有标识信息对应的存储信息,以便在读取数据块时,根据所需读取数据块的标识信息获取对应的存储信息,并根据存储信息从内存中读取数据块。实现了多台虚拟机在访问位于物理硬盘不同位置的相同数据内容时,减少了对物理硬盘的反复访问,提高了对虚拟机的读请求响应速度,并且延长了硬盘的本文档来自技高网
...

【技术保护点】
一种数据处理方法,其特征在于,包括:扫描物理硬盘上存储的、与各个虚拟硬盘对应的数据块,获取各个虚拟硬盘之间数据块内容相同的各重复数据块组,并在重复数据记录表中存储各重复数据块组中各数据块的标识信息和存储信息的对应关系;当各重复数据块组中任一数据块从所述物理硬盘中存储到内存中时,根据内存地址更新所述重复数据记录表中所述数据块所在的重复数据块组中的所有存储信息,以便在读取数据块时,根据所需读取数据块的标识信息获取对应的存储信息,并根据所述存储信息从所述内存中读取所述数据块。

【技术特征摘要】
1.一种数据处理方法,其特征在于,包括 扫描物理硬盘上存储的、与各个虚拟硬盘对应的数据块,获取各个虚拟硬盘之间数据块内容相同的各重复数据块组,并在重复数据记录表中存储各重复数据块组中各数据块的标识信息和存储信息的对应关系; 当各重复数据块组中任一数据块从所述物理硬盘中存储到内存中时,根据内存地址更新所述重复数据记录表中所述数据块所在的重复数据块组中的所有存储信息,以便在读取数据块时,根据所需读取数据块的标识信息获取对应的存储信息,并根据所述存储信息从所述内存中读取所述数据块。2.根据权利要求1所述的数据处理方法,其特征在于,所述获取各个虚拟硬盘之间数据块内容相同的各重复数据块组包括 采用哈希算法对每个数据块的数据内容进行计算获取哈希值; 比较每个数据块的哈希值,获取各个虚拟硬盘之间哈希值相同的各重复数据块组。3.根据权利要求1或2所述的数据处理方法,其特征在于,还包括 接收携带标识信息的数据块写入请求; 根据所述标识信息查询所述重复数据记录表,若判断获知所述重复数据记录表中存储有与所述标识信息对应的存储信息,则根据所述标识信息将所述数据块写入所述物理硬盘中,并删除所述重复数据记录表中与所述数据块对应的存储信息。4.根据权利要求1或2所述的数据处理方法,其特征在于,所述根据所需读取数据块的标识信息获取对应的存储信息,并根据所述存储信息从所述内存中读取所述数据块包括 接收携带标识信息的数据块读取请求; 根据所述标识信息查询所述重复数据记录表,若判断获知所述重复数据记录表中存储有与所述标识信息对应的存储信息,且所述存储信息标识所述数据块存储在所述内存中,则根据所述存储信息从所述内存中读取所述数据块。5.根据权利要求4所述的数据处理方法,其特征在于,还包括 若所述存储信息标识所述数据块存储在所述物理硬盘中,则根据所述标识信息从所述物理硬盘存储中读取所述数据块,并将所述数据块存储到所述内存中,并更新所述重复数据记录表中与所述数...

【专利技术属性】
技术研发人员:任努努
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1