【技术实现步骤摘要】
本专利技术涉及大数据领域,具体涉及一种基于布隆过滤器的大数据比对方法、装置、计算设备和计算机存储介质。
技术介绍
1、随着移动互联网技术的发展,移动通信系统每天都会生成海量的测量数据,如pm(performance management,性能管理数据)、mr(measurement report,测量报告数据)等。这些数据由基站采集后,经过omc系统处理生成可以被其他大数据系统使用的数据文件。在此过程中,omc系统的输入数据为南向数据,omc系统的输出数据为北向数据。南向数据和北向数据均为结构化数据,由行、列组成,每一列均有唯一的列名,用于表示该列数据的含义,每一行均有唯一键,作为该行的唯一标志。南向数据和北向数据之间存在映射关系,北向数据中某列的值是基于南向数据中的一列或多列计算得到的,因此,南向数据和由南向数据计算生成的北向数据具有唯一键。
2、由于omc系统通常由设备厂家控制,而南向数据中包含大量网络质量指标,因此就会存在厂家通过控制omc系统篡改输出的北向数据,造成北向数据失真的风险。而为了校验北向数据的准确性,就需
...【技术保护点】
1.一种基于布隆过滤器的大数据比对方法,包括:
2.根据权利要求1所述的方法,其中,所述遍历北向数据,根据所述北向数据生成第一字符串集进一步包括:
3.根据权利要求2所述的方法,其中,所述北向唯一键包含时间戳、站点ID和小区ID;所述每一行的北向数据内容包含时间戳、站点ID、小区ID、指标名称和指标值。
4.根据权利要求1所述的方法,其中,所述遍历南向数据,获取所述南向数据中每一行对应的南向唯一键;根据所述南向数据与所述北向数据之间的预设映射关系,生成每个所述南向唯一键对应的第二字符串,得到第二字符串集进一步包括:
5.
...【技术特征摘要】
1.一种基于布隆过滤器的大数据比对方法,包括:
2.根据权利要求1所述的方法,其中,所述遍历北向数据,根据所述北向数据生成第一字符串集进一步包括:
3.根据权利要求2所述的方法,其中,所述北向唯一键包含时间戳、站点id和小区id;所述每一行的北向数据内容包含时间戳、站点id、小区id、指标名称和指标值。
4.根据权利要求1所述的方法,其中,所述遍历南向数据,获取所述南向数据中每一行对应的南向唯一键;根据所述南向数据与所述北向数据之间的预设映射关系,生成每个所述南向唯一键对应的第二字符串,得到第二字符串集进一步包括:
5.根据权利要求1所述的方法,其中,所述南向唯一键包含时间戳、站点id和小区id。
6....
【专利技术属性】
技术研发人员:高峰,李天璞,赵宇,张惠,张文圳,耿鲁静,郑继燕,林达,李世光,梁上燕,章昊,孟宪锟,张斌,张晓彤,
申请(专利权)人:中国移动通信集团设计院有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。