数据关联方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:31375640 阅读:11 留言:0更新日期:2021-12-15 11:10
本申请涉及一种数据关联方法、装置、计算机设备和存储介质。所述方法包括:获取多条用户线下轨迹数据中的人脸标识、时间信息以及空间信息,以及目标线上用户标识对应的多个类型的线上数据源的时间信息以及空间信息,可以将线上数据与线下数据进行匹配,确定每个类型的线上数据源对应的人脸候选集;根据各线上数据源对应的权重,在各人脸候选集中确定目标线上用户标识对应的人脸标识;根据目标线上用户标识以及目标线上用户标识对应的人脸标识,关联线上数据源以及多条用户线下轨迹数据。采用本方法能够对线上标识以及线下标识进行匹配,识别用户的完整行为链,提高线上ID与线下ID打通的准确率以及用户的召回率。的准确率以及用户的召回率。的准确率以及用户的召回率。

【技术实现步骤摘要】
数据关联方法、装置、计算机设备和存储介质


[0001]本申请涉及计算机数据处理
,特别是涉及一种数据关联方法、装置、计算机设备和存储介质。

技术介绍

[0002]随着计算机技术的飞速发展,商场的数字化程度不断提高,相关技术中可以通过客户管理系统对客户在商场内的线上消费行为进行记录,也可以通过Wi

Fi(Wireless Fidelity,无线通信)探针技术或摄像装置来获取用户在线下的轨迹数据。
[0003]然而,相关技术中均只能分别获取到用户线上行为或者线下行为,无法识别属于同一用户的线上数据和线下数据,导致无法形成属于同一用户完整的数据链。

技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种能够高精确度的数据关联方法、装置、计算机设备和存储介质。
[0005]一种数据关联方法,所述方法包括:
[0006]获取多条用户线下轨迹数据,所述用户线下轨迹数据包括人脸标识、时间信息以及空间信息;
[0007]获取目标线上用户标识对应的多个类型的线上数据源,所述线上数据源包括时间信息以及空间信息;
[0008]根据多个类型的线上数据源的时间信息以及空间信息,分别与多条所述用户线下轨迹数据的人脸标识、时间信息以及空间信息进行匹配,确定每个类型的线上数据源对应的人脸候选集,所述人脸候选集中包括多个人脸标识;
[0009]根据各所述线上数据源对应的权重,在各所述人脸候选集中确定所述目标线上用户标识对应的人脸标识;
[0010]根据所述目标线上用户标识以及所述目标线上用户标识对应的人脸标识,关联所述线上数据源以及所述多条用户线下轨迹数据。
[0011]在其中一个实施例中,所述根据各所述线上数据源对应的权重,在各所述人脸候选集中确定所述目标线上用户标识对应的人脸标识,包括:
[0012]针对各所述人脸候选集包含的每个人脸标识,确定包含所述人脸标识的目标线上数据源、以及所述目标线上数据源对应的权重;
[0013]根据所述包含所述人脸标识的目标线上数据源以及所述目标线上数据源对应的权重,计算所述人脸标识的置信度;
[0014]在各所述人脸候选集包含的各人脸标识中,确定置信度满足预设置信度条件的目标人脸标识,作为所述目标线上用户标识对应的人脸标识。
[0015]在其中一个实施例中,所述方法还包括:
[0016]如果所述置信度满足预设置信度条件的目标人脸标识包括多个人脸标识,则获取
所述目标人脸标识对应的人脸图像信息;
[0017]对各所述人脸图像信息进行身份特征识别,得到各所述人脸图像信息对应的身份特征信息;
[0018]确定身份特征信息与预先存储的所述目标线上用户标识对应的目标身份特征信息相匹配的目标人脸图像信息,并将所述目标人脸图像信息对应的目标人脸标识,确定为所述目标线上用户标识对应的人脸标识。
[0019]在其中一个实施例中,所述根据多个类型的线上数据源的时间信息以及空间信息,分别与多个所述用户线下轨迹数据的人脸标识、时间信息以及空间信息进行匹配,确定每个类型的线上数据源对应的人脸候选集,所述人脸候选集中包括多个人脸标识,包括:
[0020]针对于每一类型的线上数据源,根据所述线上数据源的时间信息以及预设误差,确定目标时间范围;
[0021]根据所述线上数据源的空间信息以及预设误差,确定目标空间范围;
[0022]在所述多条用户线下轨迹数据中,筛选时间信息符合所述目标时间范围,且空间信息符合所述目标空间范围的用户线下轨迹数据,将筛选出的所述用户线下轨迹数据对应的人脸标识划入人脸候选集内。
[0023]在其中一个实施例中,所述方法还包括:
[0024]获取所述人脸候选集内多个人脸标识对应的人脸图像信息;
[0025]对各所述人脸图像信息进行身份特征识别,得到各所述人脸图像信息对应的身份特征信息;
[0026]确定身份特征信息与预先存储的所述目标线上用户标识对应的目标身份特征信息相匹配的目标人脸图像信息,并将所述目标人脸图像信息对应的目标人脸标识,划入处理后的人脸候选集内。
[0027]在其中一个实施例中,所述方法还包括:
[0028]如果所述线上数据源包括线上人脸图像信息,则获取所述多条用户线下轨迹数据的人脸标识对应的线下人脸图像信息;通过预设人脸图像比对算法,将所述线上人脸图像信息与所述线下人脸图像信息进行比对,根据比对结果确定与所述目标线上用户标识对应的线下人脸图像信息;
[0029]如果所述线上数据源不包括线上人脸图像信息,则执行所述根据多个类型的线上数据源的时间信息以及空间信息,分别与多条所述用户线下轨迹数据的人脸标识、时间信息以及空间信息进行匹配,确定每个类型的线上数据源对应的人脸候选集,所述人脸候选集中包括多个人脸标识的步骤。
[0030]在其中一个实施例中,在所述获取多条用户线下轨迹数据的步骤之后,所述方法还包括:
[0031]获取预先存储的非目标线上用户的人脸标识;
[0032]根据所述预先存储的非目标线上用户的人脸标识,对所述多条用户线下轨迹数据进行过滤,得到处理后的多条用户线下轨迹数据。
[0033]一种数据关联装置,所述装置包括:
[0034]第一获取模块,用于获取多条用户线下轨迹数据,所述用户线下轨迹数据包括人脸标识、时间信息以及空间信息;
[0035]第二获取模块,用于获取目标线上用户标识对应的多个类型的线上数据源,所述线上数据源包括时间信息以及空间信息;
[0036]匹配模块,用于根据多个类型的线上数据源的时间信息以及空间信息,分别与多条所述用户线下轨迹数据的人脸标识、时间信息以及空间信息进行匹配,确定每个类型的线上数据源对应的人脸候选集,所述人脸候选集中包括多个人脸标识;
[0037]计算模块,用于根据各所述线上数据源对应的权重,在各所述人脸候选集中确定所述目标线上用户标识对应的人脸标识;
[0038]关联模块,用于根据所述目标线上用户标识以及所述目标线上用户标识对应的人脸标识,关联所述线上数据源以及所述多条用户线下轨迹数据。
[0039]在其中一个实施例中,所述计算模块,包括:
[0040]权重确定单元,用于针对各所述人脸候选集包含的每个人脸标识,确定包含所述人脸标识的目标线上数据源、以及所述目标线上数据源对应的权重;
[0041]置信度计算单元,用于根据所述包含所述人脸标识的目标线上数据源以及所述目标线上数据源对应的权重,计算所述人脸标识的置信度;
[0042]筛选单元,用于在各所述人脸候选集包含的各人脸标识中,确定置信度满足预设置信度条件的目标人脸标识,作为所述目标线上用户标识对应的人脸标识。
[0043]在其中一个实施例中,所述装置还包括:
[0044]人脸标识筛选模块,用于如果所述置信度满足预设置信度条件的目标人脸标识包括多个人脸标识,则获取本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据关联方法,其特征在于,所述方法包括:获取多条用户线下轨迹数据,所述用户线下轨迹数据包括人脸标识、时间信息以及空间信息;获取目标线上用户标识对应的多个类型的线上数据源,所述线上数据源包括时间信息以及空间信息;根据多个类型的线上数据源的时间信息以及空间信息,分别与多条所述用户线下轨迹数据的人脸标识、时间信息以及空间信息进行匹配,确定每个类型的线上数据源对应的人脸候选集,所述人脸候选集中包括多个人脸标识;根据各所述线上数据源对应的权重,在各所述人脸候选集中确定所述目标线上用户标识对应的人脸标识;根据所述目标线上用户标识以及所述目标线上用户标识对应的人脸标识,关联所述线上数据源以及所述多条用户线下轨迹数据。2.根据权利要求1所述的方法,其特征在于,所述根据各所述线上数据源对应的权重,在各所述人脸候选集中确定所述目标线上用户标识对应的人脸标识,包括:针对各所述人脸候选集包含的每个人脸标识,确定包含所述人脸标识的目标线上数据源、以及所述目标线上数据源对应的权重;根据所述包含所述人脸标识的目标线上数据源以及所述目标线上数据源对应的权重,计算所述人脸标识的置信度;在各所述人脸候选集包含的各人脸标识中,确定置信度满足预设置信度条件的目标人脸标识,作为所述目标线上用户标识对应的人脸标识。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:如果所述置信度满足预设置信度条件的目标人脸标识包括多个人脸标识,则获取所述目标人脸标识对应的人脸图像信息;对各所述人脸图像信息进行身份特征识别,得到各所述人脸图像信息对应的身份特征信息;确定身份特征信息与预先存储的所述目标线上用户标识对应的目标身份特征信息相匹配的目标人脸图像信息,并将所述目标人脸图像信息对应的目标人脸标识,确定为所述目标线上用户标识对应的人脸标识。4.根据权利要求1所述的方法,其特征在于,所述根据多个类型的线上数据源的时间信息以及空间信息,分别与多个所述用户线下轨迹数据的人脸标识、时间信息以及空间信息进行匹配,确定每个类型的线上数据源对应的人脸候选集,所述人脸候选集中包括多个人脸标识,包括:针对于每一类型的线上数据源,根据所述线上数据源的时间信息以及预设误差,确定目标时间范围;根据所述线上数据源的空间信息以及预设误差,确定目标空间范围;在所述多条用户线下轨迹数据中,筛选时间信息符合所述目标时间范围,且空间信息符合所述目标空间范围的用户线下轨迹数据,将筛选出的所述用户线下轨迹数据对应的人脸标识划入人脸候选集内。5.根据权利要求4所述的方法,其特征在于,所...

【专利技术属性】
技术研发人员:熊一鸣
申请(专利权)人:北京爱笔科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1