一种基于布谷鸟过滤器的海量顾客来访记录存储方法技术

技术编号:41668307 阅读:18 留言:0更新日期:2024-06-14 15:26
本发明专利技术公开了一种于布谷鸟过滤器的海量顾客来访记录存储方法,包括步骤S1:建立布谷鸟过滤器:建立两个哈希表,记为T1,T2;两个哈希函数,记为H1,H2;步骤S2:将在先不存在的访客存入布谷鸟过滤器:先根据H1函数计算出访客在T1表的位置,如果该位置为空,则将其放入,如果该位置不为空,则根据H2函数计算出访客在T2表的位置。本发明专利技术公开的一种于布谷鸟过滤器的海量顾客来访记录存储方法,用于解决现有技术中心存在的问题,其支持动态的新增和删除元素,并且提供了比传统布隆过滤器更高的查找性能。

【技术实现步骤摘要】

本专利技术属于客流统计,具体涉及一种基于布谷鸟过滤器的海量顾客来访记录存储方法


技术介绍

1、客流统计系统,需要做新老顾客的判断。现阶段的方法主要是通过布隆过滤器(bloom filter,bf)来解决,用于快速检查一个元素是否属于某个集合中。它可以快速判断一个元素是否在一个大型集合中,且判断速度很快且不占用太多内存空间。布隆过滤器的主要原理是使用一组哈希函数,将元素映射成一组位数组中的索引位置。当要检查一个元素是否在集合中时,将该元素进行哈希处理,然后查看哈希值对应的位数组的值是否为1。如果哈希值对应的位数组的值都为1,那么这个元素可能在集合中,否则这个元素肯定不在集合中。

2、由于哈希函数的映射可能会发生冲突,因此布隆过滤器可能会出现误判,即把不在集合中的元素判断为在集合中。但是,布隆过滤器不会漏判,即不会把在集合中的元素判断为不在集合中。但布隆过滤器存在一个致命的缺点是它不支持删除操作,随着时间的流逝,数据越存越多,这个过滤器的数组中1的位置越来越多,误判率就会提升,从而必需重建。

3、除了删除这个问题之外,布隆过滤器还有一本文档来自技高网...

【技术保护点】

1.一种基于布谷鸟过滤器的海量顾客来访记录存储方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于布谷鸟过滤器的海量顾客来访记录存储方法,其特征在于,在步骤S2中,使用两个相互独立的哈希函数H1和H2分别得到关于元素的映射位置h1(ele)和h2(ele),向哈希表中存入元素时,如果两个映射位置存在空闲的情况则直接插入;而如果两个映射位置都已插入元素,则随机将其中一个元素踢出所在位置,来保存待插入元素;

3.根据权利要求2所述的一种基于布谷鸟过滤器的海量顾客来访记录存储方法,其特征在于,在步骤S2中,待插入元素的映射位置为:>

4.根据权利...

【技术特征摘要】

1.一种基于布谷鸟过滤器的海量顾客来访记录存储方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于布谷鸟过滤器的海量顾客来访记录存储方法,其特征在于,在步骤s2中,使用两个相互独立的哈希函数h1和h2分别得到关于元素的映射位置h1(ele)和h2(ele),向哈希表中存入元素时,如果两个映射位置存在空闲的情况则直接插入;而如果两个映射位置都已插入元素,则随机将其中一个元素踢出所在位置,来保存待插入元素;

3.根据权利要求2所述的一种基于布谷鸟过滤器的海量顾客来访记录存储方法,其特征在于,在步骤s2中,待插入元素的映射位置为:

4.根据权利要求3所述的一种基于布谷鸟过滤器的海量顾客来访记录存储方法,其特征在于,布谷鸟过滤器发生指纹碰撞的概率为并且定位一个元素所需检查的槽个数符合u(0,dba)的离散均匀分布,d表示每个...

【专利技术属性】
技术研发人员:成琳王亚楠
申请(专利权)人:嘉兴霏云信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1