一种数据处理方法、装置、设备及存储介质制造方法及图纸

技术编号:44334579 阅读:18 留言:0更新日期:2025-02-18 20:44
本申请涉及数据存储技术领域,尤其涉及一种数据处理方法、装置、设备及存储介质,用以提高LSM数中不同键的删除效率。其中,方法包括:对于日志结构合并LSM树的任意层级,获取层级关联的各个待处理文件,即只读内存表或源SST,将其中的第一类key排序并遍历,根据预设的判定条件确定key是否无效;其中,判定条件包括如下至少一种:key自身或其对应的value满足第一取值条件,key自身或其对应的value与其前序key自身或其对应的value满足第二取值条件;第一类key为各个待处理文件中不相同的key;对于各个待处理文件,通过有效key的键值对数据生成目标SST。

【技术实现步骤摘要】

本申请涉及数据存储,尤其涉及一种数据处理方法、装置、设备及存储介质


技术介绍

1、在存储系统中,日志结构合并(log-structured merge,lsm)树及其变种被广泛用于存储元数据信息。lsm的特点是将随机的键值对数据(key-value,kv)写入操作转换为顺序的写前日志(write-ahead log,wal)写入,从而显著提升写入性能。lsm通过跳表或其他扩展结构组成内存表(memtable)/只读内存表(immutable),并在磁盘上采用有序的排序字符串表(sorted string table,sst)组织,以提供高速的kv查找性能。

2、在使用lsm存储kv时,相同的键(key)如果需要写入多次,会以追加的模式写入,这样可能在lsm中同时存在多个相同键的记录,其中只有一条记录是有效的(查询可见)。当immtable下沉到sst,或者sst之间进行合并时,会选择最后写入的相同键及其对应的值写入目标sst中,并删除源sst,从而确保在lsm中,对于相同键仅存在一条记录。

3、相关技术中,只有相同键可以在sst合本文档来自技高网...

【技术保护点】

1.一种数据处理方法,其特征在于,所述方法包括:

2.如权利要求1所述的方法,其特征在于,所述目标参数包括第一类key自身,则所述第一取值条件包括如下至少一种:key的大小在所述层级关联的第一预设范围内,经过第一预设规则转换后的key与所述层级关联的第一指定参数相同;

3.如权利要求1所述的方法,其特征在于,所述各个待处理文件为:所述层级中实时生成的至少一个待下沉的只读内存表,或者,所述层级与其相邻层级中实时生成的多个待合并的源SST,或者,所述层级中实时生成的多个待合并的源SST;

4.如权利要求1所述的方法,其特征在于,所述各个待处理文件为对所述层...

【技术特征摘要】

1.一种数据处理方法,其特征在于,所述方法包括:

2.如权利要求1所述的方法,其特征在于,所述目标参数包括第一类key自身,则所述第一取值条件包括如下至少一种:key的大小在所述层级关联的第一预设范围内,经过第一预设规则转换后的key与所述层级关联的第一指定参数相同;

3.如权利要求1所述的方法,其特征在于,所述各个待处理文件为:所述层级中实时生成的至少一个待下沉的只读内存表,或者,所述层级与其相邻层级中实时生成的多个待合并的源sst,或者,所述层级中实时生成的多个待合并的源sst;

4.如权利要求1所述的方法,其特征在于,所述各个待处理文件为对所述层级进行后台扫描得到的至少一个只读内存表,或者,对所述层级及其相邻层级进行后台扫描得到的多个源sst,或者,对所述层级进行后台扫描得到的多个源sst;

5.如权利要求4所述的方法,其特征在于,所述根据每...

【专利技术属性】
技术研发人员:康撼宇何振石胜男季旻王顺卓
申请(专利权)人:曙光信息产业股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1