【技术实现步骤摘要】
一种虚拟化资源镜像存储系统及其实现方法
[0001]本专利技术涉及云计算
,特别是涉及一种虚拟化资源镜像存储系统及其实现方法。
技术介绍
[0002]云计算技术与虚拟化技术的不断发展,使得越来越多的企业开始部署公有云与私有云,云计算的IaaS(基础设施即服务)与PaaS(平台即服务)模式以虚拟化资源镜像为服务形式向租户提供计算服务,用户可以根据自身需要在云端创建虚拟机或者容器资源,并以此获取操作系统以及平台服务。
[0003]为了对平台提供良好的运行支撑,虚拟机镜像被广泛应用于云计算的各个领域。某些企业中的虚拟机镜像数量会高达5000~20000个。而容器化技术依靠存储占用小,启动速度快,系统开销小,简化的应用程序开发、部署和管理等特点迅速发展,很大程度上增大了容器镜像存储市场规模。
[0004]虚拟机镜像的构成方式会导致大量添零数据块的产生,这些数据块对于镜像存储系统来说是重复的、无效的。此外,容器镜像是按层存储的,在容器镜像叠加层(Layer)的过程中,每新增加一层,镜像的大小就会有大幅度增长。不同镜像中包含相同的公共依赖项(例如,库文件),这也导致不同的容器镜像往往包含大量重复数据。
[0005]为了减少数据冗余,重复数据删除是一种常见的减少冗余数据的方法。在虚拟机镜像存储中,分块去重技术日渐成熟,通过分块去重算法去掉重复数据;而在容器镜像存储中,通常只对容器镜像的层进行去重处理,但是容器镜像的层很少完全相同,在容器镜像中使用的层共享技术不能有效降低存储空间损耗,直接像虚拟机镜像使 ...
【技术保护点】
【技术特征摘要】
1.一种虚拟化资源镜像存储系统,其特征在于,包括FUSE文件系统、镜像重复数据删除系统;所述FUSE文件系统接收来自若干镜像服务的R/W请求,并将R/W请求发送给镜像重复数据删除系统,镜像重复数据删除系统分析R/W请求中R请求的内容,调用FUSE文件系统从磁盘中取出所需的数据返回给镜像服务;根据R/W请求中W请求对镜像去重并通过FUSE文件系统将去重产生的镜像元数据、索引数据和数据块存储到磁盘。2.根据权利要求1所述的一种虚拟化资源镜像存储系统,其特征在于,所述镜像重复数据删除系统包括分块去重模块以及与其连接的元数据管理模块、索引单元、多级缓存管理模块;所述分块去重模块用于:对虚拟机镜像和容器镜像进行分块并删除重复数据;所述元数据管理模块用于:对元数据表进行读/写操作,元数据表中存储虚拟机镜像指纹值、名称、作者、版本号、数据块指纹值及其数据块排列顺序;所述索引单元用于:对索引表进行读/写操作,索引表中存储键值对索引数据;所述多级缓存管理模块用于:处理磁盘间的数据提取、数据写入操作。3.根据权利要求2所述的一种虚拟化资源镜像存储系统,其特征在于,所述分块去重模块包括虚拟机镜像分块去重单元和容器镜像分块去重单元;根据虚拟机镜像中零块多的特点,所述虚拟机镜像分块去重单元用于:采用固定块长分块算法对虚拟机镜像按照8KB大小的固定长度分割,得到若干数据块,使用Hash算法计算出数据块的指纹值,通过查询索引表中的节点key值,查看该指纹值是否存在于索引表中,如果存在,则证明该数据块及其指纹值已经存储在系统中;如果不存在,将该指纹值和数据块地址按照<key:value>的方式存储到索引表中;所述容器镜像分块去重单元用于:使用CDC可变长分块算法对容器镜像分块,数据块的长度定义在最小值r和最大值D之间,可变长度的数据块用一个大小为w滑动窗口来划分,当滑动窗口在位置k的Hash值f满足f mod D=r时,该位置k为数据块的一个边界,重复这个过程,直到整个容器镜像都被分块;分块结束后通过Hash算法计算出数据块的指纹值,并将该指纹值和数据块地址按照<key:value>的方式存储到索引表中。4.根据权利要求2所述的一种虚拟化资源镜像存储系统,其特征在于,所述元数据管理模块存储元数据表,并对元数据表中的数据包括虚拟机镜像指纹值、名称、作者、版本号、数据块指纹值及其数据块排列顺序进行增、删、改、查处理。5.根据权利要求2所述的一种虚拟化资源镜像存储系统,其特征在于,所述多级缓存管理模块包括对HDD机械硬盘、SSD硬盘、NVMe磁盘和内存的管理;在NVMe磁盘中存储索引表和元数据表;SSD硬盘中存储容器镜像层、高热度的虚拟机镜像数据块,高热度的虚拟机镜像数据块是指访问次数多的数据块,即访问次数多于某一数值的数据块;HDD机械硬盘中存储容器镜像数据库、低热度的虚拟机镜像数据块,低热度的虚拟机镜像数据块是指访问次数少的数据块,即访问次数少于某一数值的数据块。6.根据权利要求5所述的一种虚拟化资源镜像存储系统,其特征在于,所述索引单元为三级B树索引单元,每级索引均存放键值对数据<key:value&g...
【专利技术属性】
技术研发人员:杨美红,王天伟,郭莹,王继彬,袁梦,孙明辉,曹文泰,陈泳杰,
申请(专利权)人:山东省计算中心国家超级计算济南中心,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。