一种采用学习索引加速Key-Value存储系统读操作的方法技术方案

技术编号:41677703 阅读:22 留言:0更新日期:2024-06-14 15:32
本发明专利技术公开了一种采用学习索引加速Key‑Value存储系统读操作的方法,包括以下步骤:S1,将整个键空间细分为多个连续的区间,这些区间被称作“桶”,每个桶负责存储一定范围内的键值对;S2,采用模型插入的学习索引来定位桶,每个桶中的学习索引采用缓冲插入技术,学习和调整键值对的位置信息;S3,确定数据应位于的桶,进行数据的写入和组织,并更新索引表;S4,对学习索引进行动态更新和训练,即索引表更新后,系统会重新训练桶内的学习索引,确保它能够准确地反映键值对的最新分布情况;S5,进行垃圾回收的智能化处理,以维护存储效率和系统性能;S6,进行数据的读取和检索;S7,构建动态索引表。本发明专利技术旨在提升系统在快速存储设备上的读性能。

【技术实现步骤摘要】

本专利技术涉及数据读取领域,特别涉及一种采用学习索引加速key-value存储系统读操作的方法。


技术介绍

1、在数据密集型的应用场景中,高效的数据访问至关重要。传统的解决方案往往依赖于经典的索引结构,例如跳表和b+树,这些结构能够以对数时间复杂度o(log n)实现数据检索。虽然这些通用数据结构在许多场合都表现出色,但它们并未针对数据的特定分布进行优化。传统索引的局限性在于它们固有的设计,这些设计未能充分利用数据分布的潜在规律。然而,数据往往遵循某种特定的分布模式,这些模式如果被有效识别和利用,可以极大提高索引的效率。借助机器学习的强大能力,我们可以深入理解数据的分布特性,并据此建立预测模型。学习索引是这一理念的应用,它通过分析数据分布,利用机器学习算法来预测数据索引的位置。与传统索引相比,学习索引不仅能够描述数据的分布,而且能够预测具有特定分布特征的数据的位置,从而实现常数时间复杂度(o(1))的数据访问。

2、在现代键值存储系统中,lsm-tree(日志结构合并树)由于其出色的写入性能和高效的空间利用率而成为基础结构的核心组件。尽管如此,本文档来自技高网...

【技术保护点】

1.一种采用学习索引加速Key-Value存储系统读操作的方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的方法,其特征在于:步骤S1中桶的大小和范围是根据数据分布和访问模式设计的,以保持均匀的数据分布和最优的检索效率。

3.根据权利要求1所述的方法,其特征在于:步骤S2中所述的学习索引使用PLR来对数据建模,在学习和查找期间具有低开销;且所述学习索引采用的缓冲结构是哈希表,用于临时存储正在写入的数据,优化写入性能;且在磁盘上,每个桶都维护着多个有序字符串表,用于持久存储排序后的数据。

4.根据权利要求3所述的方法,其特征在于,步骤S3中所述的...

【技术特征摘要】

1.一种采用学习索引加速key-value存储系统读操作的方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的方法,其特征在于:步骤s1中桶的大小和范围是根据数据分布和访问模式设计的,以保持均匀的数据分布和最优的检索效率。

3.根据权利要求1所述的方法,其特征在于:步骤s2中所述的学习索引使用plr来对数据建模,在学习和查找期间具有低开销;且所述学习索引采用的缓冲结构是哈希表,用于临时存储正在写入的数据,优化写入性能;且在磁盘上,每个桶都维护着多个有序字符串表,用于持久存储排序后的数据。

4.根据权利要求3所述的方法,其特征在于,步骤s3中所述的数据的写入和组织具体为:当新数据到达时,首先利用学习索引确定数据应位于的桶,并将数据写入对应桶的哈希缓冲区;达到一定量的数据后,哈希缓冲区内容会被排序,并以有序字符串表的形式写入磁盘,同时索引表会更新以反映新的键值对位置。

5.根据权利要求3所述的方法,其特征在于:步骤s5中垃圾回收的机制具体分为两种,第一种是合并操作,当桶中的失效数据达到一定比例时,进行合并操作,清除这些数据并更新索引表,以保持存储空...

【专利技术属性】
技术研发人员:王亚轩孙辉陈银辉
申请(专利权)人:武汉汇迪森信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1