一种数据处理方法、装置、电子设备和存储介质制造方法及图纸

技术编号:30334951 阅读:23 留言:0更新日期:2021-10-10 01:00
本公开涉及一种数据处理方法、装置、电子设备和存储介质,方法包括:获取数据库中的用户标识数据及各个用户标识数据之间的第一目标关联关系;根据用户标识数据及第一目标关联关系构建连通图,连通图包括多个连通子图;针对每个连通子图,排除连通子图中的根节点,得到与连通子图对应的至少两个子连通衍图;获取至少两个子连通衍图之间的相似度;根据子连通衍图之间的相似度确定子连通衍图的第二目标关联关系,并基于子连通衍图的第二目标关联关系生成目标连通子图,实现将同一自然人对应的用户标识数据串联在一起,消除数据孤岛。消除数据孤岛。消除数据孤岛。

【技术实现步骤摘要】
一种数据处理方法、装置、电子设备和存储介质


[0001]本公开涉及数据处理
,尤其涉及一种数据处理方法、装置、电子设备和存储介质。

技术介绍

[0002]随着互联网技术的日渐成熟,人们的消费和行为习惯发生了巨大的变化,人们连入互联网的方式也呈多元发展。在日常生活中,用户可以随时随地的通过手机APP、PC、微信小程序、H5、O2O中的任意一种方式去接入某公司不同域的业务系统,使得用户能够浏览、查询或咨询相关感兴趣的内容。相应的,该公司不同域的业务系统中就会产生同一个用户的不同行为特征数据。在未进行处理前,这些行为特征数据彼此之间可能是孤立的,不仅无法利用起来,而且还不便于管理,所以出于加强数据管理的目的,很多公司会建立以“人”为中心的“一人一档”数据管理业务,即将各种业务系统中的行为特征数据进行汇聚起来,然后将同一个用户在该公司全域的行为特征数据串联在一起,消除数据孤岛。
[0003]现有技术中,现有技术中通过构建连通图将具有关联关系的用户标识数据进行关联,但是当同一连通子图中包括不同自然人的用户标识数据时,无法对自然人进行区别。

技术实现思路

[0004]为了解决上述技术问题或者至少部分地解决上述技术问题,本公开提供了一种数据处理方法、装置、电子设备和存储介质。
[0005]第一方面,本公开实施例提供了一种数据处理方法,包括:获取数据库中的用户标识数据及各个所述用户标识数据之间的第一目标关联关系;根据所述用户标识数据及所述第一目标关联关系构建连通图,所述连通图包括多个连通子图,每个所述连通子图中的每一个节点对应一个所述用户标识数据,每个所述连通子图中的每一条连接线对应一个所述第一目标关联关系;针对每个所述连通子图,排除所述连通子图中的根节点,得到与所述连通子图对应的至少两个子连通衍图;获取所述至少两个子连通衍图之间的相似度;根据所述子连通衍图之间的相似度确定所述子连通衍图的第二目标关联关系,并基于所述子连通衍图的第二目标关联关系生成目标连通子图,所述目标连通子图包括至少两个子连通衍图的节点。
[0006]可选的,所述根据所述子连通衍图之间的相似度确定所述子连通衍图的第二目标关联关系,并基于所述子连通衍图的第二目标关联关系生成目标连通子图,包括:根据所述子连通衍图中各主节点之间的用户标识特征相似度确定所述子连通衍图中各主节点的第二目标关联关系,并基于所述子连通衍图的第二目标关联关系生成目标子连通衍图;将排除的所述连通子图中的根节点添加到生成的所述目标子连通衍图中并生成目标连通子图。
[0007]可选的,所述根据所述子连通衍图中各主节点之间的用户标识特征相似度确定所述子连通衍图中各主节点的第二目标关联关系,并基于所述子连通衍图的第二目标关联关系生成目标子连通衍图,包括:在所述子连通衍图中的主节点的用户标识相似度满足预设用户标识相似度时,建立所述主节点之间的第二目标关联关系;根据所述主节点之间的第二目标关联关系生成目标子连通衍图。
[0008]可选的,所述根据所述子连通衍图之间的相似度确定所述子连通衍图的第二目标关联关系,并基于子连通衍图的第二目标关联关系生成目标连通子图,包括:根据所述子连通衍图中各从节点之间的用户标识特征相似度确定所述子连通衍图中与所述从节点对应的各主节点的第二目标关联关系,并基于所述子连通衍图的第二目标关联关系并生成目标子连通衍图;将排除的所述连通子图中的根节点添加到生成的所述目标子连通衍图中并生成目标连通子图。
[0009]可选的,所述根据所述子连通衍图中各从节点之间的用户标识特征相似度确定所述子连通衍图中与所述从节点对应的各主节点的第二目标关联关系,并基于所述子连通衍图的第二目标关联关系生成目标子连通衍图,包括:在所述子连通衍图的从节点的用户标识相似度满足预设用户标识相似度时,建立与所述从节点存在第一目标关联关系的主节点之间的第二目标关联关系;根据与所述从节点存在第一目标关联关系的主节点之间的第二目标关联关系生成目标子连通衍图。
[0010]可选的,所述获取数据库中的用户标识数据及各个所述用户标识数据之间的第一目标关联关系,包括:获取数据库中的用户标识数据及各个所述用户标识数据之间的第一关联关系;当两个用户标识数据之间存在多个相同的第一关联关系时,选取置信度较高的第一关联关系作为第一目标关联关系。
[0011]可选的,所述根据所述子连通衍图之间的相似度确定所述子连通衍图的第二目标关联关系,并基于所述子连通衍图的第二目标关联关系生成目标连通子图之后,还包括:给每一个所述目标连通子图分配唯一标识符。
[0012]可选的,所述给每一个所述目标连通子图分配唯一标识符之后,还包括:周期性的提取数据库中新增的用户标识数据及各个所述用户标识数据之间新增的第一目标关联关系;将新增的所述用户标识数据作为新的节点添加到所述连通图中;依据新增的所述第一目标关联关系将所述连通子中具有第一目标关联关系的所述用户标识数据通过所述连接线相连接;给未分配唯一标识符的连通子图分配唯一标识符;当存在具有两个或多个唯一标识符的连通子图,按照设定规则从所述两个或多个唯一标识符中选择其中一个作为最终的唯一标识符。
[0013]可选的,所述按照设定规则从所述两个或多个唯一标识符中选择其中一个作为最终的唯一标识符,包括:
从所述两个或多个唯一标识符中选择分配时间最早的一个作为最终的唯一标识符。
[0014]第二方面,本公开实施例提供一种数据处理装置,包括:数据获取模块,用于获取数据库中的用户标识数据及各个所述用户标识数据之间的第一目标关联关系;连通图构建模块,用于根据所述用户标识数据及所述第一目标关联关系构建连通图,所述连通图包括多个连通子图,每个所述连通子图中的每一个节点对应一个所述用户标识数据,每个所述连通子图中的每一条连接线对应一个所述第一目标关联关系;目标连通子图生成模块,用于针对每个所述连通子图,排除所述连通子图中的根节点,得到与所述连通子图对应的至少两个子连通衍图;获取所述至少两个子连通衍图之间的相似度;根据所述子连通衍图之间的相似度确定所述子连通衍图的第二目标关联关系,并基于所述子连通衍图的第二目标关联关系生成目标连通子图,所述目标连通子图包括至少两个子连通衍图的节点。
[0015]第三方面,本公开实施例提供一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面中任一所述的数据处理方法。
[0016]第四方面,本公开实施例提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如第一方面中任一所述的数据处理方法。
[0017]本公开实施例提供的技术方案与现有技术相比具有如下优点:本公开实施例提供的数据的处理方法、装置、电子设备和存储介质,根据数据库中的用户标识数据以及各个用户标识数据之间的第一目标关联关系构建多个连通子图,针对每一个连通子图,排除连通子图中的根节点,得到与连通子图对应的至少本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:获取数据库中的用户标识数据及各个所述用户标识数据之间的第一目标关联关系;根据所述用户标识数据及所述第一目标关联关系构建连通图,所述连通图包括多个连通子图,每个所述连通子图中的每一个节点对应一个所述用户标识数据,每个所述连通子图中的每一条连接线对应一个所述第一目标关联关系;针对每个所述连通子图,排除所述连通子图中的根节点,得到与所述连通子图对应的至少两个子连通衍图;获取所述至少两个子连通衍图之间的相似度;根据所述子连通衍图之间的相似度确定所述子连通衍图的第二目标关联关系,并基于所述子连通衍图的第二目标关联关系生成目标连通子图,所述目标连通子图包括至少两个子连通衍图的节点。2.根据权利要求1所述的数据处理方法,其特征在于,所述根据所述子连通衍图之间的相似度确定所述子连通衍图的第二目标关联关系,并基于所述子连通衍图的第二目标关联关系生成目标连通子图,包括:根据所述子连通衍图中各主节点之间的用户标识特征相似度确定所述子连通衍图中各主节点的第二目标关联关系,并基于所述子连通衍图的第二目标关联关系生成目标子连通衍图;将排除的所述连通子图中的根节点添加到生成的所述目标子连通衍图中并生成目标连通子图。3.根据权利要求2所述的数据处理方法,其特征在于,所述根据所述子连通衍图中各主节点之间的用户标识特征相似度确定所述子连通衍图中各主节点的第二目标关联关系,并基于所述子连通衍图的第二目标关联关系生成目标子连通衍图,包括:在所述子连通衍图中的主节点的用户标识相似度满足预设用户标识相似度时,建立所述主节点之间的第二目标关联关系;根据所述主节点之间的第二目标关联关系生成目标子连通衍图。4.根据权利要求1所述的数据处理方法,其特征在于,所述根据所述子连通衍图之间的相似度确定所述子连通衍图的第二目标关联关系,并基于子连通衍图的第二目标关联关系生成目标连通子图,包括:根据所述子连通衍图中各从节点之间的用户标识特征相似度确定所述子连通衍图中与所述从节点对应的各主节点的第二目标关联关系,并基于所述子连通衍图的第二目标关联关系并生成目标子连通衍图;将排除的所述连通子图中的根节点添加到生成的所述目标子连通衍图中并生成目标连通子图。5.根据权利要求4所述的数据处理方法,其特征在于,所述根据所述子连通衍图中各从节点之间的用户标识特征相似度确定所述子连通衍图中与所述从节点对应的各主节点的第二目标关联关系,并基于所述子连通衍图的第二目标关联关系并生成目标子连通衍图,包括:在所述子连通衍图的从节点的用户标识相似度满足预设用户标识相似度时,建立与所述从节点存在第一目标关联关系的主节点之间的第二目标关联关系;根据与所述从节点存在第一目标关联关系的主节点之间的第二目标关联关系生成目标子连通衍图...

【专利技术属性】
技术研发人员:常霄王托黎积东陈晓倩
申请(专利权)人:北京世纪好未来教育科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1