一种基于LSM-tree的KV存储系统读性能的缓存优化方法技术方案

技术编号：33244075 阅读：12 留言：0更新日期：2022-04-27 17:51

本发明专利技术公开了一种基于LSM

全部详细技术资料下载

【技术实现步骤摘要】
一种基于LSM
‑
tree的KV存储系统读性能的缓存优化方法

[0001]本专利技术涉及一种基于LSM
‑
tree的KV存储系统读性能的缓存优化方法，属于存储系统的

技术介绍

[0002]现如今很多KV存储系统是基于LSM
‑
tree(Log
‑
Structured
‑
Merge Tree)设计的，如LevelDB、RocksDB等。LSM
‑
tree主要有三部分组成：MemTable、Immutable MemTable、SSTable(即SST)，如图1所示。MemTable和Immutable MemTable是存在在内存中的组件。最新更新的数据保存在MemTable中，当MemTable达到一定大小后，会转化成Immutable MemTable。因为数据暂时保存在内存中，内存并不是可靠存储，如果断电会丢失数据，因此通常会通过WAL(Write
‑
ahead logging)的方式来保证数据的可靠性。然后Immutable MemTable会刷到磁盘上变成L0上的SST。SST(Sorted String Table)是有序键值对集合，SST在磁盘上，并且分为很多层，每一层都有多个SST，每个SST的数据容量是固定的。每一层的数据都是按照键大小排好序的，除了L0层以外，是为了Immutable MemTable中的数据能快速的刷到磁盘上面。为了加快SST的读取，可以通过建立键...

【技术保护点】

【技术特征摘要】
1.一种基于LSM
‑
tree的KV存储系统读性能的缓存优化方法，其特征在于，包括以下步骤：步骤1、在KV存储系统的内存中加入缓存KeyRange Cache和BF Cache，其中KeyRange Cache的分层结构与磁盘上SSTable的分层结构相同，使得KeyRange Cache中每一层的条目都与磁盘上相应层的SST一一对应，并且KeyRange Cache中每一层的每一个条目缓存磁盘上所对应SST的键范围(min,max)、记录磁盘上所对应SST最近一次被访问的次序的计序值count和一个指向缓存中BF Cache或指向空的BFPointer指针，其中计序值count用来判断数据热度；所述BF Cache缓存只有含热数据的SST的布隆过滤器；步骤2、对数据进行冷热分离，判别出热数据和冷数据；若判别为热数据则将对应的布隆过滤器缓存至BFCache中，并将BFPointer指针指向BFCache；若判别为冷数据，则将BFPointer指针设为NULL；步骤3、对指定键为k1进行查询，包括：步骤3
‑
1、先依次查询内存中的MemTable和Immutable MenTable，若找到直接返回k1的value，若未找到则继续搜索缓存的KeyRange Cache中条目的缓存信息，搜索KeyRange Cache时从低往高逐层搜索，若在第i层的条目找到包含k1的键范围，则执行步骤3
‑
2；若此层未找到包含k1的键范围，则继续往下一层进行搜索；步骤3
‑
2、判断第i层找到包含k1键范围的条目在磁盘上对应的SST是否存储有热数据：若该条目的BFPointer指针指向BFCache，即磁盘上对应的SST存储有热数据，那么从BFCache中对应布隆过滤器判断k1是否存在，如果存在则直接从磁盘上对应的SST中读出k1的value，如果不存在则在KeyRange Cache中搜索下一层；若该条目的BFPointer指针指向空，即磁盘上对应的SST存储的都是冷数据，只能在磁盘对应的SST中读取布隆过滤器信息判断k1是否存在，若存在则读出k1的value，不存在则继续查询KeyRange Cache中的下一层；步骤3
‑
3、查找成功后更新KeyRange Cache的条目中记录的计序值count，使得k1所对应的磁盘上的SST被标为热；若一直搜索到KeyRange Cache的最后一层都未找到k1，则查找失败。2.根据权利要求1所述基于LSM
‑
tree的KV存储系统读性能的缓存优化方法，其特征在于，所述步骤2中...

【专利技术属性】
技术研发人员：陈思晔，陈珊珊，
申请(专利权)人：南京邮电大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人