当前位置: 首页 > 专利查询>陈磊专利>正文

标识信息提取方法、装置、电子设备及计算机存储介质制造方法及图纸

技术编号:35290219 阅读:45 留言:0更新日期:2022-10-22 12:36
本发明专利技术涉及一种标识信息提取方法、装置、电子设备及计算机存储介质,其方法包括:获取至少两个平台分别对应的用户数据集合,每一用户数据集合中包含至少一个用户标识信息;基于每一平台对应的第一用户标识信息构建针对该平台的布隆过滤器;将所述至少两个平台对应的布隆过滤器按照预设组合方式进行组合,得到组合布隆过滤器;查询每一用户标识信息是否存在于所述组合布隆过滤器中,若所述组合布隆过滤器中存在第二用户标识信息,提取所述第二用户标识信息。本发明专利技术在提取标识信息时减少了其他标识信息隐私泄露的风险。标识信息隐私泄露的风险。标识信息隐私泄露的风险。

【技术实现步骤摘要】
标识信息提取方法、装置、电子设备及计算机存储介质


[0001]本专利技术涉及元素查询匹配的算法
,尤其涉及一种标识信息提取方法、装置、电子设备及计算机存储介质。

技术介绍

[0002]随着计算机技术的蓬勃发展,基于各种平台关联数据进行研究成为了一个热点。
[0003]现有技术中针对来自多平台的数据进行关联时的常用操作是通常是第一个平台直接将该平台的数据集合发送给第二个平台,第二个平台对接收的数据集合与其本身的数据集合进行求交集操作,并提取交集数据中的用户标识信息,并将交集结果发送给第一个平台。这种情况中是两个平台直接进行数据交互,那么就存在隐私泄露风险。
[0004]因此,如何解决现有技术中标识信息提取时隐私泄露的问题是一个亟待解决的问题。

技术实现思路

[0005]有鉴于此,有必要提供一种标识信息提取方法、装置、电子设备及计算机存储介质,用以解决现有技术中标识信息提取时隐私泄露的问题。
[0006]为了解决上述问题,第一方面本专利技术提供一种标识信息提取方法,包括:
[0007]获取至少两个平台分别对应的用户数据集合,每一用户数据集合中包含至少一个用户标识信息;
[0008]基于每一平台对应的第一用户标识信息构建针对该平台的布隆过滤器;
[0009]将所述至少两个平台对应的布隆过滤器按照预设组合方式进行组合,得到组合布隆过滤器;
[0010]查询每一用户标识信息是否存在于所述组合布隆过滤器中,若所述组合布隆过滤器中存在第二用户标识信息,提取所述第二用户标识信息。
[0011]进一步的,所述基于每一平台对应的第一用户标识信息构建针对该平台的布隆过滤器,包括:
[0012]获取针对每一平台的初始布隆过滤器,所述初始布隆过滤器中的每一位置的值置为0;
[0013]利用所述初始布隆过滤器中的哈希算法计算每一第一用户标识信息在所述初始布隆过滤器中的位置;
[0014]将所述第一用户标识信息在所述初始布隆过滤器的位置置为1,得到每一平台对应的布隆过滤器。
[0015]进一步的,所述初始布隆过滤器的数据结构包含m个单元的比特数组,以及K个不相同的哈希算法,其中,所述哈希算法的计算结果包含m个不同的值。
[0016]进一步的,所述将所述至少两个平台对应的布隆过滤器按照预设组合方式进行组合,得到组合布隆过滤器,包括:
[0017]将每一平台对应的布隆过滤器逐个进行按位与操作,生成所述组合布隆过滤器。
[0018]进一步的,所述查询每一用户标识信息是否存在于所述组合布隆过滤器中,包括:
[0019]针对所述每一用户标识信息使用所述哈希算法计算,得到哈希值;
[0020]基于所述哈希值确定所述用户标识信息在所述组合布隆过滤器的数组下标;
[0021]若所述数组下标为0,则所述用户标识信息不存在于所述组合布隆过滤器中;
[0022]若所述数组下标为1,则所述用户标识信息存在于所述组合布隆过滤器中。
[0023]进一步的,所述若所述组合布隆过滤器中存在第二用户标识信息,提取所述第二用户标识信息,包括:
[0024]若所述用户标识信息存在于所述组合布隆过滤器中,标记所述用户标识信息为第二用户标识信息,并在每一平台对应的用户数据集合平台中提取所述第二用户标识信息。
[0025]进一步的,所述方法还包括:
[0026]整合每一第二用户标识信息在所述至少两个平台的标签信息,并将所述标签信息发送至指定平台,以使所述指定平台基于所述标签信息确定推荐信息。
[0027]第二方面,本专利技术还提供一种标识信息提取装置,包括:
[0028]获取模块,用于获取至少两个平台分别对应的用户数据集合,每一用户数据集合中包含至少一个用户标识信息;
[0029]构建模块,用于基于每一平台对应的第一用户标识信息构建针对该平台的布隆过滤器;
[0030]组合模块,用于将所述至少两个平台对应的布隆过滤器按照预设组合方式进行组合,得到组合布隆过滤器;
[0031]提取模块,用于查询每一用户标识信息是否存在于所述组合布隆过滤器中,若所述组合布隆过滤器中存在第二用户标识信息,提取所述第二用户标识信息。
[0032]第三方面,本专利技术还提供一种电子设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述标识信息提取方法中的步骤。
[0033]第四方面,本专利技术还提供一种计算机存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现如上述标识信息提取方法中的步骤。
[0034]采用上述实施例的有益效果是:
[0035]本专利技术通过根据每一平台对应的第一用户标识信息构建针对该平台的布隆过滤器,在构建之初协商使用相同的布隆过滤器结构,为后续进行数据查询提供基础,并且将每一平台对应的布隆过滤器组合成组合布隆过滤器,通过查询每一用户标识信息是否存在于组合布隆器过滤器中确定该用户标识信息是否为用户交集标识信息,如果是,则提取该用户交集标识信息,即第二用户标识信息。本专利技术避免了各个平台直接将标识信息进行交互,从根本上防止了用户隐私信息外泄,提高了交互的安全性。
附图说明
[0036]图1为本专利技术提供的标识信息提取方法的一实施例的流程示意图;
[0037]图2为本专利技术一实施例提供一种布隆过滤器的结构示意图;
[0038]图3为本专利技术提供的标识信息提取装置的一实施例的结构示意图;
[0039]图4为本专利技术提供的一种电子设备的结构示意图。
具体实施方式
[0040]下面结合附图来具体描述本专利技术的优选实施例,其中,附图构成本申请一部分,并与本专利技术的实施例一起用于阐释本专利技术的原理,并非用于限定本专利技术的范围。
[0041]在本专利技术的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本专利技术的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
[0042]本专利技术提供了一种标识信息提取方法、装置、电子设备及计算机存储介质,以下分别进行说明。
[0043]请参阅图1,图1为本专利技术提供的标识信息提取方法的一实施例的流程示意图,本专利技术的一个具体实施例,公开了一种标识信息提取方法,包括:
[0044]步骤S101:获取至少两个平台分别对应的用户数据集合,每一用户数据集合中包含至少一个用户标识信息;
[0045]其中,平台为用户标识信息的持有者,这些用户信息持有者在某些限制条件下各自拥有一个用户数据集合,每一数据集合中的每条用户数据可以由一个用户标识信息来进行检索。
[0046]举例而言,假设A是本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种标识信息提取方法,其特征在于,包括:获取至少两个平台分别对应的用户数据集合,每一用户数据集合中包含至少一个用户标识信息;基于每一平台对应的第一用户标识信息构建针对该平台的布隆过滤器;将所述至少两个平台对应的布隆过滤器按照预设组合方式进行组合,得到组合布隆过滤器;查询每一用户标识信息是否存在于所述组合布隆过滤器中,若所述组合布隆过滤器中存在第二用户标识信息,提取所述第二用户标识信息。2.根据权利要求1所述的标识信息提取方法,其特征在于,所述基于每一平台对应的第一用户标识信息构建针对该平台的布隆过滤器,包括:获取针对每一平台的初始布隆过滤器,所述初始布隆过滤器中的每一位置的值置为0;利用所述初始布隆过滤器中的哈希算法计算每一第一用户标识信息在所述初始布隆过滤器中的位置;将所述第一用户标识信息在所述初始布隆过滤器的位置置为1,得到每一平台对应的布隆过滤器。3.根据权利要求2所述的标识信息提取方法,其特征在于,所述初始布隆过滤器的数据结构包含m个单元的比特数组,以及K个不相同的哈希算法,其中,所述哈希算法的计算结果包含m个不同的值。4.根据权利要求1所述的标识信息提取方法,其特征在于,所述将所述至少两个平台对应的布隆过滤器按照预设组合方式进行组合,得到组合布隆过滤器,包括:将每一平台对应的布隆过滤器逐个进行按位与操作,生成所述组合布隆过滤器。5.根据权利要求1所述的标识信息提取方法,其特征在于,所述查询每一用户标识信息是否存在于所述组合布隆过滤器中,包括:针对所述每一用户标识信息使用所述哈希算法计算,得到哈希值;基于所述哈希值确定所述用户标识信息在所述组合布隆过滤器的数组下标;若所述数组下标为0,则所述用户标识信...

【专利技术属性】
技术研发人员:陈磊
申请(专利权)人:陈磊
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1