用户标识映射关系建立方法、系统、设备及存储介质技术方案

技术编号:23558047 阅读:51 留言:0更新日期:2020-03-25 03:42
本发明专利技术提供了一种用户标识映射关系建立方法、系统、设备及存储介质,所述方法包括:获取用户标识数据,每条所述用户标识数据包括至少一属性组合,各个属性组合包括一属性名和对应的属性值;为每条用户标识数据添加唯一用户标识;将各个属性组合作为一第一类顶点,将各个唯一用户标识作为一第二类顶点,建立第一类顶点和第二类顶点的映射关系,以形成包括所述第一类顶点和第二类顶点的二分网络。本发明专利技术基于二分网络的思想,将原有用户标识数据进行转换清理,构建更明显简洁的数据关系;通过设置不同置信值,将二分网络中每个映射关系进行分数标记,表明其可信度和可用度,更方便下游应用业务使用,提高数据使用范围及数据质量。

Method, system, device and storage medium of user identity mapping

【技术实现步骤摘要】
用户标识映射关系建立方法、系统、设备及存储介质
本专利技术涉及数据处理
,尤其涉及一种用户标识映射关系建立方法、系统、设备及存储介质。
技术介绍
随着数据爆发式的增长,企业用户信息来源繁多,造成用户数据在多个来源系统中重复存在多种ID(Identity,身份识别码)信息,使得数据趋向于多元化、碎片化,如何准确的将不同来源的用户ID信息进行整合,并依此建立用户间关系一直是重要难题。目前业界对于信息整合的主要做法是利用ID-Mapping,其含义即为ID映射,通过设置一个独立于业务线之外的主键作为用户唯一标识,并根据数据中不同的ID进行关联整合,例如使用手机号,身份证号等强关联ID进行关联标识用户,将这些强ID相同的数据赋予一个统一的唯一标识,确保这些数据ID背后的统一性。ID-Mapping的结果数据建立了用户背后的强关系连接,建立了用户唯一标识,但是仍存在以下不足:(1)映射结果数据冗余,关联性、可读性不高;(2)用户关系没有形成完整网络,中间关系未发掘完全;(3)没有统一有效的度量标准表明数据可用度及可信本文档来自技高网...

【技术保护点】
1.一种用户标识映射关系建立方法,其特征在于,所述方法包括如下步骤:/n获取用户标识数据,每条所述用户标识数据包括至少一属性组合,各个属性组合包括一属性名和对应的属性值,将各个属性组合作为一第一类顶点;/n为每条用户标识数据添加唯一用户标识;/n将各个唯一用户标识作为一第二类顶点,建立第一类顶点和第二类顶点的映射关系,以形成包括所述第一类顶点和第二类顶点的二分网络。/n

【技术特征摘要】
1.一种用户标识映射关系建立方法,其特征在于,所述方法包括如下步骤:
获取用户标识数据,每条所述用户标识数据包括至少一属性组合,各个属性组合包括一属性名和对应的属性值,将各个属性组合作为一第一类顶点;
为每条用户标识数据添加唯一用户标识;
将各个唯一用户标识作为一第二类顶点,建立第一类顶点和第二类顶点的映射关系,以形成包括所述第一类顶点和第二类顶点的二分网络。


2.根据权利要求1所述的用户标识映射关系建立方法,其特征在于,为每条用户标识数据添加唯一用户标识时,为具有相同强关联顶点的用户标识数据添加同一唯一用户标识;
其中,属性组合与用户一一对应的第一类顶点定义为强关联顶点。


3.根据权利要求1所述的用户标识映射关系建立方法,其特征在于,形成包括所述第一类顶点和第二类顶点的二分网络之后,还包括如下步骤:
根据每条用户标识数据中各个置信因素的置信值计算每条用户标识数据的置信值。


4.根据权利要求3所述的用户标识映射关系建立方法,其特征在于,所述置信因素包括数据来源、是否实名认证、数据使用次数和数据距今最近使用时间差中的至少一种。


5.根据权利要求3或4所述的用户标识映射关系建立方法,其特征在于,根据如下公式计算每条用户标识数据的置信值CS:



其中,δ为预设的平衡因子,idi为该条用户标识数据中第i个置信因素的置信值,n为计算时所采用的置信因素的个数,I()i为预设的第i个置信因素的置信函数,wi为第i个置信因素的预设权重。


6.根据权利要求5所述的用户标识映射关系建立方法,其特征在于,所述置信因素包括数据来源、是否实名认证、数据使用次数和数据距今最近使用时间差中的至少一种;
其中,对于数据来源的置信因素,置信函数为:
I(idi)=scorej;ifidi=srcj
对于是否实名认证的置信因素,置信函数为:



对于数据使用次数的置信因素,置信函数为:



对于数据距今最近一次使用时间差的置信因素,置信函数为:



其中,srcj为第j个业务线的识别码,scorej为预设的第j个业务线的置信评分。


7.根据权利要求3所述的用户标识映射关系建立方法,其特征在于,所述计算每条用户标识数据的置信值之后,还包括如下步骤:
根据每条用户标识数据的置信值确定所述二分网络中每条映射关系的置信值。


8.根据权利要求7所述的用户标识映射关系建立方法,其特征在于,将属性组合与用户一一对应的第一类顶点定义为强关联顶点,将属性组合与用户不存在一一对应关系的第一类顶点定义为弱关联顶点;
所述根据每条用户标识数据的置信值确定所述二分网络中每条映射关系的置信值,包括如下步骤:
判断一映射关系对应的第一类顶点的类型;
如果是强关联顶点,则比较该强关联顶点所对应的各条用户标识数据的置信值,选择最大的值作为该映射关系的置信值;
如果是弱关系顶点,则确定与该映射关系对应的用户标识数据,将该对...

【专利技术属性】
技术研发人员:王云开苏金辉郭宁
申请(专利权)人:北京京东金融科技控股有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1