【技术实现步骤摘要】
用户标识映射关系建立方法、系统、设备及存储介质
本专利技术涉及数据处理
,尤其涉及一种用户标识映射关系建立方法、系统、设备及存储介质。
技术介绍
随着数据爆发式的增长,企业用户信息来源繁多,造成用户数据在多个来源系统中重复存在多种ID(Identity,身份识别码)信息,使得数据趋向于多元化、碎片化,如何准确的将不同来源的用户ID信息进行整合,并依此建立用户间关系一直是重要难题。目前业界对于信息整合的主要做法是利用ID-Mapping,其含义即为ID映射,通过设置一个独立于业务线之外的主键作为用户唯一标识,并根据数据中不同的ID进行关联整合,例如使用手机号,身份证号等强关联ID进行关联标识用户,将这些强ID相同的数据赋予一个统一的唯一标识,确保这些数据ID背后的统一性。ID-Mapping的结果数据建立了用户背后的强关系连接,建立了用户唯一标识,但是仍存在以下不足:(1)映射结果数据冗余,关联性、可读性不高;(2)用户关系没有形成完整网络,中间关系未发掘完全;(3)没有统一有效的度量标准 ...
【技术保护点】
1.一种用户标识映射关系建立方法,其特征在于,所述方法包括如下步骤:/n获取用户标识数据,每条所述用户标识数据包括至少一属性组合,各个属性组合包括一属性名和对应的属性值,将各个属性组合作为一第一类顶点;/n为每条用户标识数据添加唯一用户标识;/n将各个唯一用户标识作为一第二类顶点,建立第一类顶点和第二类顶点的映射关系,以形成包括所述第一类顶点和第二类顶点的二分网络。/n
【技术特征摘要】
1.一种用户标识映射关系建立方法,其特征在于,所述方法包括如下步骤:
获取用户标识数据,每条所述用户标识数据包括至少一属性组合,各个属性组合包括一属性名和对应的属性值,将各个属性组合作为一第一类顶点;
为每条用户标识数据添加唯一用户标识;
将各个唯一用户标识作为一第二类顶点,建立第一类顶点和第二类顶点的映射关系,以形成包括所述第一类顶点和第二类顶点的二分网络。
2.根据权利要求1所述的用户标识映射关系建立方法,其特征在于,为每条用户标识数据添加唯一用户标识时,为具有相同强关联顶点的用户标识数据添加同一唯一用户标识;
其中,属性组合与用户一一对应的第一类顶点定义为强关联顶点。
3.根据权利要求1所述的用户标识映射关系建立方法,其特征在于,形成包括所述第一类顶点和第二类顶点的二分网络之后,还包括如下步骤:
根据每条用户标识数据中各个置信因素的置信值计算每条用户标识数据的置信值。
4.根据权利要求3所述的用户标识映射关系建立方法,其特征在于,所述置信因素包括数据来源、是否实名认证、数据使用次数和数据距今最近使用时间差中的至少一种。
5.根据权利要求3或4所述的用户标识映射关系建立方法,其特征在于,根据如下公式计算每条用户标识数据的置信值CS:
其中,δ为预设的平衡因子,idi为该条用户标识数据中第i个置信因素的置信值,n为计算时所采用的置信因素的个数,I()i为预设的第i个置信因素的置信函数,wi为第i个置信因素的预设权重。
6.根据权利要求5所述的用户标识映射关系建立方法,其特征在于,所述置信因素包括数据来源、是否实名认证、数据使用次数和数据距今最近使用时间差中的至少一种;
其中,对于数据来源的置信因素,置信函数为:
I(idi)=scorej;ifidi=srcj
对于是否实名认证的置信因素,置信函数为:
对于数据使用次数的置信因素,置信函数为:
对于数据距今最近一次使用时间差的置信因素,置信函数为:
其中,srcj为第j个业务线的识别码,scorej为预设的第j个业务线的置信评分。
7.根据权利要求3所述的用户标识映射关系建立方法,其特征在于,所述计算每条用户标识数据的置信值之后,还包括如下步骤:
根据每条用户标识数据的置信值确定所述二分网络中每条映射关系的置信值。
8.根据权利要求7所述的用户标识映射关系建立方法,其特征在于,将属性组合与用户一一对应的第一类顶点定义为强关联顶点,将属性组合与用户不存在一一对应关系的第一类顶点定义为弱关联顶点;
所述根据每条用户标识数据的置信值确定所述二分网络中每条映射关系的置信值,包括如下步骤:
判断一映射关系对应的第一类顶点的类型;
如果是强关联顶点,则比较该强关联顶点所对应的各条用户标识数据的置信值,选择最大的值作为该映射关系的置信值;
如果是弱关系顶点,则确定与该映射关系对应的用户标识数据,将该对...
【专利技术属性】
技术研发人员:王云开,苏金辉,郭宁,
申请(专利权)人:北京京东金融科技控股有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。