一种采用学习索引加速Key-Value存储系统读操作的方法技术方案

技术编号：41677703 阅读：22 留言：0更新日期：2024-06-14 15:32

本发明专利技术公开了一种采用学习索引加速Key‑Value存储系统读操作的方法，包括以下步骤：S1，将整个键空间细分为多个连续的区间，这些区间被称作“桶”，每个桶负责存储一定范围内的键值对；S2，采用模型插入的学习索引来定位桶，每个桶中的学习索引采用缓冲插入技术，学习和调整键值对的位置信息；S3，确定数据应位于的桶，进行数据的写入和组织，并更新索引表；S4，对学习索引进行动态更新和训练，即索引表更新后，系统会重新训练桶内的学习索引，确保它能够准确地反映键值对的最新分布情况；S5，进行垃圾回收的智能化处理，以维护存储效率和系统性能；S6，进行数据的读取和检索；S7，构建动态索引表。本发明专利技术旨在提升系统在快速存储设备上的读性能。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及数据读取领域，特别涉及一种采用学习索引加速key-value存储系统读操作的方法。

技术介绍

1、在数据密集型的应用场景中，高效的数据访问至关重要。传统的解决方案往往依赖于经典的索引结构，例如跳表和b+树，这些结构能够以对数时间复杂度o(log n)实现数据检索。虽然这些通用数据结构在许多场合都表现出色，但它们并未针对数据的特定分布进行优化。传统索引的局限性在于它们固有的设计，这些设计未能充分利用数据分布的潜在规律。然而，数据往往遵循某种特定的分布模式，这些模式如果被有效识别和利用，可以极大提高索引的效率。借助机器学习的强大能力，我们可以深入理解数据的分布特性，并据此建立预测模型。学习索引是这一理念的应用，它通过分析数据分布，利用机器学习算法来预测数据索引的位置。与传统索引相比，学习索引不仅能够描述数据的分布，而且能够预测具有特定分布特征的数据的位置，从而实现常数时间复杂度(o(1))的数据访问。

2、在现代键值存储系统中，lsm-tree(日志结构合并树)由于其出色的写入性能和高效的空间利用率而成为基础结构的...

【技术保护点】

1.一种采用学习索引加速Key-Value存储系统读操作的方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的方法，其特征在于：步骤S1中桶的大小和范围是根据数据分布和访问模式设计的，以保持均匀的数据分布和最优的检索效率。

3.根据权利要求1所述的方法，其特征在于：步骤S2中所述的学习索引使用PLR来对数据建模，在学习和查找期间具有低开销；且所述学习索引采用的缓冲结构是哈希表，用于临时存储正在写入的数据，优化写入性能；且在磁盘上，每个桶都维护着多个有序字符串表，用于持久存储排序后的数据。

4.根据权利要求3所述的方法，其特征在于，步骤S3中所述的...

【技术特征摘要】

1.一种采用学习索引加速key-value存储系统读操作的方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的方法，其特征在于：步骤s1中桶的大小和范围是根据数据分布和访问模式设计的，以保持均匀的数据分布和最优的检索效率。

3.根据权利要求1所述的方法，其特征在于：步骤s2中所述的学习索引使用plr来对数据建模，在学习和查找期间具有低开销；且所述学习索引采用的缓冲结构是哈希表，用于临时存储正在写入的数据，优化写入性能；且在磁盘上，每个桶都维护着多个有序字符串表，用于持久存储排序后的数据。

4.根据权利要求3所述的方法，其特征在于，步骤s3中所述的数据的写入和组织具体为：当新数据到达时，首先利用学习索引确定数据应位于的桶，并将数据写入对应桶的哈希缓冲区；达到一定量的数据后，哈希缓冲区内容会被排序，并以有序字符串表的形式写入磁盘，同时索引表会更新以反映新的键值对位置。

5.根据权利要求3所述的方法，其特征在于：步骤s5中垃圾回收的机制具体分为两种，第一种是合并操作，当桶中的失效数据达到一定比例时，进行合并操作，清除这些数据并更新索引表，以保持存储空...

【专利技术属性】
技术研发人员：王亚轩，孙辉，陈银辉，
申请(专利权)人：武汉汇迪森信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人