匹配设备信息的方法和装置制造方法及图纸

技术编号:24251668 阅读:22 留言:0更新日期:2020-05-22 23:38
本申请公开了一种匹配设备信息的方法和装置,其中,该方法包括:读取待匹配设备信息,其中,待匹配设备信息包括搜索字段区;根据搜索字段区确定待匹配设备信息所属的匹配单元,其中,匹配单元预存有与搜索字段区处于同一分区的设备信息;判断匹配单元中是否包含待匹配设备信息,以确定待匹配设备信息的匹配结。本申请解决了相关技术中为了确定匹配结果,通过join函数与海量设备ID库进行匹配,导致匹配速度慢的技术问题。

Methods and devices for matching equipment information

【技术实现步骤摘要】
匹配设备信息的方法和装置
本申请涉及信息匹配领域,具体而言,涉及一种匹配设备信息的方法和装置。
技术介绍
随着互联网、物联网等技术的发展,近些年人类所积累的数据正在呈爆炸式增长,大数据时代已经来临。然而,伴随着数据爆炸式增长,仅互联网的广告投放,就可以日均生成8亿的设备标识(Identitydocument,ID),这些设备标识可以为手机的唯一识别码、垃圾邮件地址、广告弹窗地址等,一年下来这些设备ID可以组合成数量庞大的设备ID库。在一些业务场景下,需要查询给定的一批设备ID,快速计算出其在设备ID库中的匹配率。相关技术中通常采用布式数据存储格式来存储设备ID库,用Hive或者Spark来读取待匹配设备信息,通过join函数来与海量的设备ID库进行匹配。显然,由于查询涉及的数量庞大,这种方式的匹配速度特别慢。针对相关技术中为了确定匹配结果,通过join函数与海量设备ID库进行匹配,导致匹配速度慢的技术问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种匹配设备信息的方法和装置,以至少解决相关技术中为了确定匹配结果,通过join函数与海量设备ID库进行匹配,导致匹配速度慢的技术问题。根据本专利技术实施例的一个方面,提供了一种匹配设备信息的方法,包括:读取待匹配设备信息,其中,待匹配设备信息包括搜索字段区;根据搜索字段区确定待匹配设备信息所属的匹配单元,其中,匹配单元预存有与搜索字段区处于同一分区的设备信息;判断匹配单元中是否包含待匹配设备信息,以确定待匹配设备信息的匹配结果。可选地,待匹配设备信息和设备信息的数据格式相同。可选地,在根据搜索字段区确定待匹配设备信息所属的匹配单元之前,上述方法还包括:生成匹配单元,其中,匹配单元基于如下方式生成:获取设备信息库,其中,设备信息库中的每个设备信息包括搜索字段区;根据搜索字段区对设备信息库进行分组,生成多个匹配单元。可选地,在确定待匹配设备信息的匹配结果之后,上述方法还包括:如果匹配结果表征匹配单元中不包含待匹配设备信息,将待匹配设备信息添加至设备信息库。可选地,在生成多个匹配单元之后,上述方法还包括:基于匹配单元建立哈希表,其中,哈希表中的键表征搜索字段区,键对应的值表征相同搜索字段区的待匹配设备信息。可选地,根据搜索字段区确定待匹配设备信息所属的匹配单元,包括:从哈希表中查找与搜索字段区相同的键,确定键对应的单元为匹配单元。可选地,待匹配设备信息来自待匹配设备信息库,在确定待匹配设备信息的匹配结果之后,上述方法还包括:遍历待匹配设备信息库中的待匹配设备信息,得到每个待匹配设备信息的匹配结果;基于每个待匹配设备信息的匹配结果,确定待匹配设备信息库的匹配率。根据本专利技术实施例的另一方面,还提供了一种匹配设备信息的装置,包括:读取模块,用于读取待匹配设备信息,其中,待匹配设备信息包括搜索字段区;第一确定模块,用于根据搜索字段区确定待匹配设备信息所属的匹配单元,其中,匹配单元预存有与搜索字段区处于同一分区的设备信息;第二确定模块,用于判断匹配单元中是否包含待匹配设备信息,以确定待匹配设备信息的匹配结果。根据本专利技术实施例的另一方面,还提供了一种计算机存储介质,计算机存储介质存储有多条指令,指令适于由处理器加载并执行上述任意一种匹配设备信息的方法。根据本专利技术实施例的另一方面,还提供了一种电子设备,包括:处理器和存储器;其中,存储器存储有计算机程序,计算机程序适于由处理器加载并执行上述任意一种匹配设备信息的方法。在本专利技术实施例中,采用以下步骤:读取待匹配设备信息,其中,待匹配设备信息包括搜索字段区;根据搜索字段区确定待匹配设备信息所属的匹配单元,其中,匹配单元预存有与搜索字段区处于同一分区的设备信息;判断匹配单元中是否包含待匹配设备信息,以确定待匹配设备信息的匹配结果。与相关技术相比,本申请将设备信息预存在不同的匹配单元中,通过搜索字段区确定待匹配设备信息所属的匹配单元,从而在匹配单元中查询待匹配设备信息,解决了相关技术中为了确定匹配结果,通过join函数与海量设备ID库进行匹配,导致匹配速度慢的技术问题,达到了提高匹配速度的目的。附图说明此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:图1是根据本专利技术实施例1的一种可选的匹配设备信息的方法流程图;图2是根据本专利技术实施例1的一种可选的生成匹配单元的方法流程图;图3是根据本专利技术实施例1的一种可选的确定待匹配设备信息库的匹配率的方法流程图;以及图4是根据本专利技术实施例2的一种可选的匹配设备信息的装置示意图。具体实施方式需要说明的是,在不冲突的情况下,本申请中的各实施例及实施例中的特征可以相互组合。为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。另外,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。实施例1根据本专利技术实施例,提供了一种匹配设备信息的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。图1是根据本专利技术实施例的匹配设备信息的方法,如图1所示,该方法可以包括如下步骤:步骤S102,读取待匹配设备信息,其中,待匹配设备信息包括搜索字段区。一种可选方案中,上述待匹配信息可以为手机的唯一识别码、垃圾邮件地址、广告弹窗地址等,总之,数量庞大、且需要查询的设备信息均可以包括在内,在此不作限定。上述搜索字段区可以位于待匹配设备信息的字段任意位置处,例如前两位,后三位等,位数的多少根据设备信息的数量而定。设备信息的数量越多,位数越多。步骤S104,根据搜索字段区确定待匹配设备信息所属的匹配单元,其中,匹配单元预存有与搜索字段区处于同一分区的设备信息。一种可选方案中,上述匹配单元可以为具有查找判断功能的数据库,例如布隆过滤器(BloomFilter本文档来自技高网
...

【技术保护点】
1.一种匹配设备信息的方法,其特征在于,包括:/n读取待匹配设备信息,其中,所述待匹配设备信息包括搜索字段区;/n根据所述搜索字段区确定所述待匹配设备信息所属的匹配单元,其中,所述匹配单元预存有与所述搜索字段区处于同一分区的设备信息;/n判断所述匹配单元中是否包含所述待匹配设备信息,以确定所述待匹配设备信息的匹配结果。/n

【技术特征摘要】
1.一种匹配设备信息的方法,其特征在于,包括:
读取待匹配设备信息,其中,所述待匹配设备信息包括搜索字段区;
根据所述搜索字段区确定所述待匹配设备信息所属的匹配单元,其中,所述匹配单元预存有与所述搜索字段区处于同一分区的设备信息;
判断所述匹配单元中是否包含所述待匹配设备信息,以确定所述待匹配设备信息的匹配结果。


2.根据权利要求1所述的方法,其特征在于,所述待匹配设备信息和所述设备信息的数据格式相同。


3.根据权利要求1所述的方法,其特征在于,在根据所述搜索字段区确定所述待匹配设备信息所属的匹配单元之前,所述方法还包括:生成所述匹配单元,其中,所述匹配单元基于如下方式生成:
获取设备信息库,其中,所述设备信息库中的每个设备信息包括搜索字段区;
根据所述搜索字段区对所述设备信息库进行分组,生成多个所述匹配单元。


4.根据权利要求3所述的方法,其特征在于,在确定所述待匹配设备信息的匹配结果之后,所述方法还包括:
如果匹配结果表征所述匹配单元中不包含所述待匹配设备信息,将所述待匹配设备信息添加至所述设备信息库。


5.根据权利要求3所述的方法,其特征在于,在生成多个所述匹配单元之后,所述方法还包括:
基于所述匹配单元建立哈希表,其中,所述哈希表中的键表征所述搜索字段区,所述键对应的值表征相同搜索字段区的待匹配设备信息。


6...

【专利技术属性】
技术研发人员:杨同洲
申请(专利权)人:北京深演智能科技股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1