【技术实现步骤摘要】
一种数据处理方法以及数据处理装置
本申请实施例涉及数据处理
,尤其涉及一种数据处理方法以及数据处理装置。
技术介绍
数据库系统可以采用摘要数据结构来表示和存储数据集,并支持常数时间复杂度的近似成员查询,典型摘要数据结构包括布隆过滤器及其变种,以及,布谷鸟过滤器及其变种。布隆过滤器利用固定长度的比特向量中k个比特的值来表征元素是否属于给定集合,提供常数时间复杂度的元素插入和查询,但布隆过滤器查询性能弱,容易导致极高的查询的误报率;另外,布隆过滤器的空间利用效率低,且不支持反向操作。相比之下,布谷过滤器提供两个候选单元格来存储元素指纹,可实现精确的元素表示以及常数时间复杂度的查询与删除。然而,布谷鸟过滤器序列性地插入、查询和删除元素容易导致数据操作耗时,处理效率低,此种局限性在面对大体量数据集时尤为明显。
技术实现思路
本申请实施例的目的在于提供一种数据处理方法以及数据处理装置,用于改善数据操作的操作效率。基于上述目的,第一方面,本申请实施例提供一种数据处理方法,包括:获 ...
【技术保护点】
1.一种数据处理方法,其特征在于,包括:/n获取目标元素;/n计算得到所述目标元素的元素指纹;/n通过全局哈希函数根据所述元素指纹选取过滤器的分段;/n在选取的所述分段中采用布谷鸟哈希算法对所述元素指纹进行数据处理;/n其中,所述过滤器包括多个分段,所述分段包括多个存储单元格,所述存储单元格包括多个用于存储所述元素指纹的存储位。/n
【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:
获取目标元素;
计算得到所述目标元素的元素指纹;
通过全局哈希函数根据所述元素指纹选取过滤器的分段;
在选取的所述分段中采用布谷鸟哈希算法对所述元素指纹进行数据处理;
其中,所述过滤器包括多个分段,所述分段包括多个存储单元格,所述存储单元格包括多个用于存储所述元素指纹的存储位。
2.根据权利要求1所述的数据处理方法,其特征在于,在选取的所述分段中采用布谷鸟哈希算法对所述元素指纹进行数据处理步骤包括:
根据所述元素指纹选取两个所述存储单元格为两个候选单元格;
在所述元素指纹能够存入两个所述候选单元格时,将所述元素指纹存入;
在所述元素指纹无法存入两个所述候选单元格时,随机将两个所述候选单元格中已经存在的第一指纹踢出,并将所述元素指纹存入所述第一指纹空出的所述存储位。
3.根据权利要求2所述的数据处理方法,其特征在于,被踢出的所述第一指纹进入重分配步骤,所述重分配步骤包括:
根据所述第一指纹以及所述第一指纹被踢出前所在的存储单元格,获得与所述第一指纹对应的另一存储单元格;
当所述第一指纹能够存入所述另一存储单元格时,将所述第一指纹存入;
当所述第一指纹无法存入所述另一存储单元格时,随机将所述另一候选单元格中已经存在的第二指纹踢出,将所述第一指纹存入所述第二指纹空出的位置。
4.根据权利要求3所述的数据处理方法,其特征在于,所述将所述第一指纹存入所述第二指纹空出的位置步骤之后还包括:
更新所述第一指纹为所述第二指纹,循环所述重分配步骤,直至所有元素指纹存入或者循环次数超过阈值。
5.根据权利要求1所述的数据处理方法,其特征在于,在选取的所述分段中采用布谷鸟哈希算法对所述元素指纹进行数据处理步骤包括:
根据所述元素指纹选取两个所述存储单元格为两个...
【专利技术属性】
技术研发人员:郭得科,罗来龙,廖汉龙,袁昊,武睿,
申请(专利权)人:中国人民解放军国防科技大学,
类型:发明
国别省市:湖南;43
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。