一种数据存储方法及装置制造方法及图纸

技术编号:12665160 阅读:70 留言:0更新日期:2016-01-07 02:49
本申请提供了一种数据存储方法及装置。所述方法包括:从内存中获取需要存储至固态硬盘中的数据;将所述数据以日志结构合并树的数据结构缓存至磁性硬盘中;对所述磁性硬盘中缓存的数据执行合并操作;当所述磁性硬盘中缓存的数据容量达到预设容量时,将合并后的数据存储至所述固态硬盘中。采用本申请的方法或装置,可以解决对小粒度数据进行更新时产生的写放大问题,延长固态硬盘的使用寿命。

【技术实现步骤摘要】

本申请涉及数据处理领域,特别是涉及一种数据存储方法及装置
技术介绍
随着基于闪存的固态存储技术的发展,固态硬盘(Solid State Disk, SSD)逐渐被引入到存储系统中。因其小粒度随机读性能较高,SSD通常被用于对每秒进行读写(I/O)操作(Input/Output Operat1ns Per Second, I OPS)需求较高的应用场景中。另一方面,多路搜索树(B-tree)是一种较常见的数据结构。使用B-tree结构可以显著减少定位记录时所经历的中间过程,从而加快存取速度。因此,为了进一步提高数据的存取速度,现有技术中对于SSD中的数据,大多采用B-tree的数据结构进行存储。在SSD中,更新数据的方式为异地更新。所谓异地更新,是指当一个存储节点中的数据发生变化时,在SSD中会将新的数据存储在另外的存储节点中,然后再删除原来的存储节点中的数据。但是,由于B-tree结构中定义的数据存储的最小节点的数据容量一般为4KB,因此,当发生更新的数据粒度较小(例如只有100B)时,仍然需要对4KB的存储节点进行重新写。由此可见,在SSD中采用B-tree的数据结构,导致了对小粒度数据进行更新时产生了写放大问题。众所周知,SSD的读写速度快,但寿命较短。SSD中的每个存储节点的写入次数是有限的。因此,现有技术中的数据存储方法中,对小粒度数据进行更新时产生的写放大问题,会严重影响SSD的使用寿命。
技术实现思路
本申请的目的是提供一种数据存储方法及装置,能够通过将数据以LSM-tree的方式缓存在磁性硬盘中,解决对小粒度数据进行更新时产生的写放大问题,延长SSD的使用寿命。为实现上述目的,本申请提供了如下方案:根据本申请的第一方面的第一种可能的实现方式,本申请提供一种数据存储方法,所述方法包括:从内存中获取需要存储至固态硬盘中的数据;将所述数据以日志结构合并树的数据结构缓存至磁性硬盘中;对所述磁性硬盘中缓存的数据执行合并操作;当所述磁性硬盘中缓存的数据容量达到预设容量时,将合并后的数据存储至所述固态硬盘中。结合第一方面的第二种可能的实现方式,对所述磁性硬盘中缓存的数据执行合并操作,具体包括:确定所述磁性硬盘中缓存的数据的键名以及版本号;在具有相同键名的数据中,确定最新生成的数据对应的最新版本号;保留所述最新版本号对应的数据;删除另外的版本号对应的数据。结合第一方面的第三种可能的实现方式,所述将合并后的数据存储至所述固态硬盘中,具体包括:将合并后的数据写入所述内存;将写入所述内存中的所述合并后的数据存储至所述固态硬盘中。结合第一方面的第三种可能的实现方式的第一种具体实现方式,所述将合并后的数据写入所述内存之前,还包括:判断所述内存中是否已经存有所述合并后的数据;如果是,则直接将所述内存中存有的所述合并后的数据存储至所述固态硬盘中;否则,执行将合并后的数据写入所述内存的步骤。结合第一方面的第四种可能的实现方式,所述将合并后的数据存储至所述固态硬盘中之前,还包括:判断所述磁性硬盘的空闲带宽是否大于预设阈值;如果是,则将合并后的数据以排序的字符串表为单位存储至所述固态硬盘中;否则,继续执行将所述数据以日志结构合并树的数据结构缓存至磁性硬盘的步骤。结合第一方面的第五种可能的实现方式,所述将合并后的数据存储至所述固态硬盘中之前,还包括:在所述合并后的数据中,确定更新频率小于预设频率的数据;所述将合并后的数据存储至所述固态硬盘中,具体包括:将所述更新频率小于预设频率的数据存储至所述固态硬盘中。结合第一方面的五种可能的实现方式中的任意一种,所述合并后的数据以多路搜索树的数据结构存储在所述固态硬盘中。结合第一方面的五种可能的实现方式中的任意一种,所述日志结构合并树的索引持久存储于所述磁性硬盘中。根据本申请的第二方面的第一种可能的实现方式,本申请提供一种数据存储装置,所述装置包括:数据获取单元,用于从内存中获取需要存储至固态硬盘中的数据;缓存单元,用于将所述数据以日志结构合并树的数据结构缓存至磁性硬盘中;合并单元,用于对所述磁性硬盘中缓存的数据执行合并操作;存储迁移单元,用于当所述磁性硬盘中缓存的数据容量达到预设容量时,将合并后的数据存储至所述固态硬盘中。结合第二方面的第二种可能的实现方式,所述合并单元,具体用于:确定所述磁性硬盘中缓存的数据的键名以及版本号;在具有相同键名的数据中,确定最新生成的数据对应的最新版本号;保留所述最新版本号对应的数据;删除另外的版本号对应的数据。结合第二方面的第三种可能的实现方式,所述存储迁移单元,具体用于:将合并后的数据写入所述内存;将写入所述内存中的所述合并后的数据存储至所述固态硬盘中。结合第二方面的第三种可能的实现方式的第一种具体的实现方式,第一判断单元,用于在将合并后的数据写入所述内存之前,判断所述内存中是否已经存有所述合并后的数据;所述存储迁移单元,用于当所述第一判断单元的判断结果为是时,直接将所述内存中存有的所述合并后的数据存储至所述固态硬盘中;当所述第一判断单元的判断结果为是时,执行将合并后的数据写入所述内存的步骤。结合第二方面的第四种可能的实现方式,还包括:第二判断单元,用于在将合并后的数据存储至所述固态硬盘中之前,判断所述磁性硬盘的空闲带宽是否大于预设阈值;所述存储迁移单元,用于当所述第二判断单元的判断结果为是时,则将合并后的数据以排序的字符串表为单位存储至所述固态硬盘中;当所述第二判断单元的判断结果为否时,继续执行将所述数据以日志结构合并树的数据结构缓存至磁性硬盘的步骤。结合第二方面的第五种可能的实现方式,还包括:数据确定单元,用于在将合并后的数据存储至所述固态硬盘中之前,在所述合并后的数据中,确定更新频率小于预设频率的数据;所述存储迁移单元,具体用于:将所述更新频率小于预设频率的数据存储至所述固态硬盘中。结合第二方面的五种可能的实现方式中的任意一种,所述合并后的数据以多路搜索树的数据结构存储在所述固态硬盘中。根据本申请提供的具体实施例,本申请公开了以下技术效果:本申请公开的数据存储方法或装置,通过将所述数据以日志结构合并树的数据结构缓存至磁性硬盘中;对所述磁性硬盘中缓存的数据执行合并操作;将合并后的数据存储至所述固态硬盘中;可以采用磁性硬盘承载小粒度数据的更新过程,并且,由于对所述磁性硬盘中缓存的数据执行了合并操作,当某个键名的数据先后生成了多个不同版本的数据时,最终可以在磁性硬盘中合并成一个版本的数据,从而使得原本对于固态硬盘的多次写入过程,可以简化为一次写入过程,解决了对小粒度数据进行更新时产生的写放大问题,可以延长SSD的使用寿命。【附图说明】为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术的数据存储方法实施例1的流当前第1页1 2 3 4 本文档来自技高网...
一种数据存储方法及装置

【技术保护点】
一种数据存储方法,其特征在于,所述方法包括:从内存中获取需要存储至固态硬盘中的数据;将所述数据以日志结构合并树的数据结构缓存至磁性硬盘中;对所述磁性硬盘中缓存的数据执行合并操作;当所述磁性硬盘中缓存的数据容量达到预设容量时,将合并后的数据存储至所述固态硬盘中。

【技术特征摘要】

【专利技术属性】
技术研发人员:刘扬宽熊劲岳银亮张子刚
申请(专利权)人:华为技术有限公司中国科学院计算技术研究所
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1