【技术实现步骤摘要】
一种异源账号关联方法、装置、设备及存储介质
本申请涉及互联网通信
,尤其涉及一种异源账号关联方法、装置、设备及存储介质。
技术介绍
在大数据环境下,不同系统间的数据间往往存在一定的关联性,建立不同系统的数据(即异源数据)间的关联,往往能创造出更大的价值;例如一些贷款系统,可以结合用户在在日常生活的缴费系统的缴费情况,更好的做出风险评估。目前,建立不同的系统中用户账号间的关联,常常会结合用户在不同的系统中上报的时空数据(位置信息和上报时间);具体的,现有技术中在结合时空数据建立账号间关联时,往往简单的基于时空数据在两个系统中的差异,无法保证确定出的关联账号对应同一用户的可靠性,导致最终确定出的关联账号的准确率低。因此,需要提供更可靠或更有效的方案。
技术实现思路
本申请提供了一种异源账号关联方法、装置、设备及存储介质,可以提高确定关联账号的准确率,有效保证确定出的关联账号对应同一用户的可靠性。一方面,本申请提供了一种异源账号关联方法,所述方法包括:获取来源于第一系统的多个预设单 ...
【技术保护点】
1.一种异源账号关联方法,其特征在于,所述方法包括:/n获取来源于第一系统的多个预设单位时间段的第一数据集和来源于第二系统的多个预设单位时间段的第二数据集,所述第一数据集和所述第二数据集均包括多个账号的三元数据,所述三元数据包括账号标识、位置信息和上报所述位置信息的上报时间;所述第一数据集对应的账号数小于所述第二数据集对应的账号数;/n根据同一预设单位时间段的第一数据集和第二数据集中位置信息将所述同一预设时间段的第一数据集和第二数据集转换成多对异源三元数据对;/n将所述异源三元数据对中上报时间之间的时间差,小于等于预设误差阈值的异源三元数据对所对应的两个账号作为目标异源账号 ...
【技术特征摘要】
1.一种异源账号关联方法,其特征在于,所述方法包括:
获取来源于第一系统的多个预设单位时间段的第一数据集和来源于第二系统的多个预设单位时间段的第二数据集,所述第一数据集和所述第二数据集均包括多个账号的三元数据,所述三元数据包括账号标识、位置信息和上报所述位置信息的上报时间;所述第一数据集对应的账号数小于所述第二数据集对应的账号数;
根据同一预设单位时间段的第一数据集和第二数据集中位置信息将所述同一预设时间段的第一数据集和第二数据集转换成多对异源三元数据对;
将所述异源三元数据对中上报时间之间的时间差,小于等于预设误差阈值的异源三元数据对所对应的两个账号作为目标异源账号对;
基于每一目标异源账号对对应的位置信息和上报时间确定所述目标异源账号对的时空不匹配度;
确定包括第一目标账号的目标异源账号对的时空不匹配度之和,所述第一目标账号为所述多个预设单位时间段的第一数据集中任一账号标识对应的账号;
基于卡方分布检验确定所述第一目标账号对应的时空匹配度之和服从于目标卡方分布的显著度,所述目标卡方分布包括自由度为两倍的第一目标账号的定位上报数量的卡方分布,所述显著度表征包括所述第一目标账号的目标异源账号对对应的两个异源账号间具有关联的可靠程度;
基于所述显著度确定所述第一系统和所述第二系统间的目标关联账号。
2.根据权利要求1所述的方法,其特征在于,所述根据同一预设单位时间段的第一数据集和第二数据集中位置信息将所述同一预设时间段的第一数据集和第二数据集转换成多对异源三元数据对包括:
根据同一预设单位时间段的第一数据集和第二数据集中位置信息将所述同一预设时间段的第一数据集和第二数据集映射至预设网格,所述预设网格包括多个子网格;
基于同一子网格中两两异源的三元数据生成多对异源三元数据对。
3.根据权利要求2所述的方法,其特征在于,在基于同一子网格中两两异源的三元数据生成多对异源三元数据对之前,所述方法还包括:
在所述预设网格中对所述第一数据集中的三元数据进行扩散处理;
相应的,所述基于同一子网格中两两异源的三元数据生成多对异源三元数据对包括:
基于扩散处理后同一子网格中两两异源的三元数据生成多对异源三元数据对。
4.根据权利要求3所述的方法,其特征在于,当同一目标异源账号对对应多个时空不匹配度时,在确定包括第一目标账号的目标异源账号对的时空不匹配度之和之前,所述方法还包括:
比较所述同一目标异源账号对对应的多个时空不匹配度的大小;
将最小的时空不匹配度作为所述同一目标异源账号对的时空不匹配度。
5.根据权利要求1所述的方法,其特征在于,所述基于每一目标异源账号对对应的位置信息和上报时间确定所述目标异源账号对的时空不匹配度包括:
根据每一目标异源账号对对应的位置信息确定所述目标异源账号对的空间误差;
根据每一目标异源账号对对应的上报时间确定所述目标异源账号对的时间误差;
获取预设的空间误差的标准差和预设的时间误差的标准差;
基于所述空间误差、所述时间误差、所述预设的空间误差的标准差和所述预设的时间误差的标准差确定所述目标异源账号对的时空不匹配度。
6.根据权利要求1所述的方法,其特征在于,所述基于所述显著度确定所述第一系统和所述第二系统间的目标关联账号包括:
比较包括所述第一目标账号的目标异源账号对的显著度的大小;
将所述第一目标账号对应的最小显著度所对应的目标异源账号对作为第一初选关联账号;<...
【专利技术属性】
技术研发人员:杨帆,王寰东,孙福宁,
申请(专利权)人:腾讯云计算北京有限责任公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。