The application discloses a multi-user identity fusion method, device, device and storage medium, and relates to the technical field of big data. The specific implementation scheme is as follows: obtain the user identity data, which has at least two identity features; build a map network according to at least two identity features of the user identity data, which includes: nodes representing identity features and connection edges representing association relations of identity features; according to the connection relations and nodes between nodes in the map network And the connection relationship between the connection edge to determine the identity group of the same user, which includes: multiple identity characteristics. The scheme not only can accurately identify the identity groups corresponding to multiple identity features of the same user, but also can be applied to any scene, avoiding the problem of limited use range.
【技术实现步骤摘要】
多重用户身份融合方法、装置、设备及存储介质
本申请涉及计算机
,尤其涉及一种大数据技术中的多重用户身份融合方法、装置、设备及存储介质。
技术介绍
在互联网普及的大环境下,将虚拟用户身份(例如,设备ID,网络ID等)和真实用户身份(例如,身份证号、手机号等身份信息、车产、房产等用户资产信息)相关联,可以从不同的表现载体中还原人的完整行为,从而创造巨大的产品商业价值。现有技术中,多重身份融合的方案主要可以基于预设的规则,将满足同一规则的多个不同用户身份确定为属于同一用户,并将该用户的多个用户身份进行融合,使其相互关联。然而,虽然这种融合方法归属判断的准确率高,但是由于使用的规则是人为设定的,无法应用于复杂的场景,使用范围受限。
技术实现思路
本申请实施例提供一种多重用户身份融合方法、装置、设备及存储介质,用于解决现有融合方法无法应用于复杂的场景,使用范围受限的问题。第一方面,本申请提供一种多重用户身份融合的方法,包括:获取用户身份数据,所述用户身份数据具有至少两个身份特征;根据所述用户身份数据具有的至少两个身份特征,构建图谱网络,所述图谱网络包括:表征身份特征的节点和表征身份特征的关联关系的连接边;根据所述图谱网络中节点之间的连接关系、节点和连接边之间的连接关系,确定同一用户的身份群组,所述身份群组包括:多个身份特征。在本实施例中,通过图谱网络的形式将用户身份数据具有的身份特征关联起来,不仅能够准确的确定出同一用户的多个身份特征对应
【技术保护点】
1.一种多重用户身份融合的方法,其特征在于,包括:/n获取用户身份数据,所述用户身份数据具有至少两个身份特征;/n根据所述用户身份数据具有的至少两个身份特征,构建图谱网络,所述图谱网络包括:表征身份特征的节点和表征身份特征的关联关系的连接边;/n根据所述图谱网络中节点之间的连接关系、节点和连接边之间的连接关系,确定同一用户的身份群组,所述身份群组包括:多个身份特征。/n
【技术特征摘要】
1.一种多重用户身份融合的方法,其特征在于,包括:
获取用户身份数据,所述用户身份数据具有至少两个身份特征;
根据所述用户身份数据具有的至少两个身份特征,构建图谱网络,所述图谱网络包括:表征身份特征的节点和表征身份特征的关联关系的连接边;
根据所述图谱网络中节点之间的连接关系、节点和连接边之间的连接关系,确定同一用户的身份群组,所述身份群组包括:多个身份特征。
2.根据权利要求1所述的方法,其特征在于,所述获取用户身份数据,包括:
获取预设的配置信息,所述配置信息包括:数据源类型、数据源路径、提取方式和提取周期;
根据所述数据源路径、所述提取方式和所述提取周期,从所述数据源类型对应数据源中提取所述用户身份数据。
3.根据权利要求2所述的方法,其特征在于,所述配置信息还包括:字段映射关系;
所述方法还包括:
根据所述字段映射关系,依次对获取到的所述用户身份数据进行解析,提取所述用户身份数据具有的至少两个身份特征。
4.根据权利要求1所述的方法,其特征在于,所述根据所述图谱网络中节点之间的连接关系、节点和连接边之间的连接关系,确定同一用户的身份群组,包括:
根据所述图谱网络中节点之间的连接关系、节点和连接边之间的连接关系,确定所述图谱网络中相邻节点间的连接次数;
基于所述图谱网络中相邻节点间的连接次数和预设的次数阈值,确定出第一连接关系和第二连接关系,所述第一连接关系为相邻节点间的连接次数大于所述次数阈值的连接关系,所述第二连接关系为相邻节点间的连接次数小于或等于所述次数阈值的连接关系;
根据所述第一连接关系、所述第二连接关系,以目标节点为起点,依次向外遍历所述图谱网络的节点,确定出所述目标节点对应用户的身份群组。
5.根据权利要求1所述的方法,其特征在于,所述根据所述图谱网络中节点之间的连接关系、节点和连接边之间的连接关系,确定同一用户的身份群组,包括:
根据所述图谱网络中节点之间的连接关系、节点和连接边之间的连接关系以及各节点具有的属性信息,确定出节点间的关联关系;
基于所述节点间的关联关系,对所述图谱网络中的节点进行聚合,确定同一用户的身份群组。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述方法还包括:
根据同一用户的身份群组,确定所述身份群组中与目标身份特征具有关联关系的多个用户身份特征,所述目...
【专利技术属性】
技术研发人员:张阳,杨双全,刘畅,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。