一种基于布隆过滤器的大数据比对方法、装置及设备制造方法及图纸

技术编号:42956938 阅读:31 留言:0更新日期:2024-10-11 16:14
本发明专利技术公开了一种基于布隆过滤器的大数据比对方法和装置。根据本发明专利技术提供的技术方案,获取待比对的南向数据和北向数据;遍历北向数据,根据北向数据生成第一字符串集,并将其中的各个第一字符串存入布隆过滤器中;遍历南向数据,获取南向数据中每一行对应的南向唯一键;根据南向数据与北向数据之间的预设映射关系,生成每个南向唯一键对应的第二字符串,得到第二字符串集;判断其中的任一第二字符串是否存在于布隆过滤器中,若任一第二字符串不存在于布隆过滤器中,则确定任一第二字符串对应的北向数据为风险数据。通过本发明专利技术将南北向数据写入布隆过滤器,完成数据安全性监测,同时,大大降低了数据比对的时间和空间复杂度,以及计算资源成本。

【技术实现步骤摘要】

本专利技术涉及大数据领域,具体涉及一种基于布隆过滤器的大数据比对方法、装置、计算设备和计算机存储介质。


技术介绍

1、随着移动互联网技术的发展,移动通信系统每天都会生成海量的测量数据,如pm(performance management,性能管理数据)、mr(measurement report,测量报告数据)等。这些数据由基站采集后,经过omc系统处理生成可以被其他大数据系统使用的数据文件。在此过程中,omc系统的输入数据为南向数据,omc系统的输出数据为北向数据。南向数据和北向数据均为结构化数据,由行、列组成,每一列均有唯一的列名,用于表示该列数据的含义,每一行均有唯一键,作为该行的唯一标志。南向数据和北向数据之间存在映射关系,北向数据中某列的值是基于南向数据中的一列或多列计算得到的,因此,南向数据和由南向数据计算生成的北向数据具有唯一键。

2、由于omc系统通常由设备厂家控制,而南向数据中包含大量网络质量指标,因此就会存在厂家通过控制omc系统篡改输出的北向数据,造成北向数据失真的风险。而为了校验北向数据的准确性,就需要对南、北向数据进行本文档来自技高网...

【技术保护点】

1.一种基于布隆过滤器的大数据比对方法,包括:

2.根据权利要求1所述的方法,其中,所述遍历北向数据,根据所述北向数据生成第一字符串集进一步包括:

3.根据权利要求2所述的方法,其中,所述北向唯一键包含时间戳、站点ID和小区ID;所述每一行的北向数据内容包含时间戳、站点ID、小区ID、指标名称和指标值。

4.根据权利要求1所述的方法,其中,所述遍历南向数据,获取所述南向数据中每一行对应的南向唯一键;根据所述南向数据与所述北向数据之间的预设映射关系,生成每个所述南向唯一键对应的第二字符串,得到第二字符串集进一步包括:

5.根据权利要求1所述的...

【技术特征摘要】

1.一种基于布隆过滤器的大数据比对方法,包括:

2.根据权利要求1所述的方法,其中,所述遍历北向数据,根据所述北向数据生成第一字符串集进一步包括:

3.根据权利要求2所述的方法,其中,所述北向唯一键包含时间戳、站点id和小区id;所述每一行的北向数据内容包含时间戳、站点id、小区id、指标名称和指标值。

4.根据权利要求1所述的方法,其中,所述遍历南向数据,获取所述南向数据中每一行对应的南向唯一键;根据所述南向数据与所述北向数据之间的预设映射关系,生成每个所述南向唯一键对应的第二字符串,得到第二字符串集进一步包括:

5.根据权利要求1所述的方法,其中,所述南向唯一键包含时间戳、站点id和小区id。

6....

【专利技术属性】
技术研发人员:高峰李天璞赵宇张惠张文圳耿鲁静郑继燕林达李世光梁上燕章昊孟宪锟张斌张晓彤
申请(专利权)人:中国移动通信集团设计院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1