数据关联方法及装置、电子设备制造方法及图纸

技术编号:22075769 阅读:48 留言:0更新日期:2019-09-12 14:09
本发明专利技术公开了一种数据关联方法及装置、电子设备。其中,该方法包括:获取多个字段集,其中,每个字段集包含有语义相同的多个字段数据;确定每两个字段数据在对应的字段集中的字段值,并确定每两个字段数据是否属于同一用户的权重值;根据字段值和权重值,确定每个用户的连通集合,其中,连通集合中包含的各个字段数据相互关联且都属于同一用户。本发明专利技术解决了相关技术中各个字段数据关联性较低的技术问题。

Data Association Method, Device and Electronic Equipment

【技术实现步骤摘要】
数据关联方法及装置、电子设备
本专利技术涉及数据处理
,具体而言,涉及一种数据关联方法及装置、电子设备。
技术介绍
在相关技术中,很多数据公司会从多个数据源获取到字段数据(或用户数据),包括获取用户持有的终端物理地址、通信地址、所处地理位置、登录的应用APP等,对这些数据,各个公司都会进行相应的处理,然后根据处理结果,向用户推荐用户喜爱的内容,但是当前,在处理数据时,往往是针对具体的应用和所持有的设备来确定字段数据所属的目标用户,无法打通各个字段数据所属的用户,各个字段数据之间的关联性较低,导致对于同一用户或者其它自然个体,可能推送相同的内容,且数据统计上很不方便。针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种数据关联方法及装置、电子设备,以至少解决相关技术中各个字段数据关联性较低的技术问题。根据本专利技术实施例的一个方面,提供了一种数据关联方法,包括:获取多个字段集,其中,每个所述字段集包含有语义相同的多个字段数据;确定每两个所述字段数据在对应的所述字段集中的字段值,并确定每两个所述字段数据是否属于同一用户的权重值;根据所述字段值和所述权重本文档来自技高网...

【技术保护点】
1.一种数据关联方法,其特征在于,包括:获取多个字段集,其中,每个所述字段集包含有语义相同的多个字段数据;确定每两个所述字段数据在对应的所述字段集中的字段值,并确定每两个所述字段数据是否属于同一用户的权重值;根据所述字段值和所述权重值,确定每个用户的连通集合,其中,所述连通集合中包含的各个字段数据相互关联且都属于同一用户。

【技术特征摘要】
1.一种数据关联方法,其特征在于,包括:获取多个字段集,其中,每个所述字段集包含有语义相同的多个字段数据;确定每两个所述字段数据在对应的所述字段集中的字段值,并确定每两个所述字段数据是否属于同一用户的权重值;根据所述字段值和所述权重值,确定每个用户的连通集合,其中,所述连通集合中包含的各个字段数据相互关联且都属于同一用户。2.根据权利要求1所述的方法,其特征在于,获取多个字段集的步骤,包括:提取多个数据源的字段数据,得到字段总集合;利用预设的语义数据库和/或预设的语义分辨规则,确定所述字段总集合中每个所述字段数据所属的字段集,得到所述多个字段集。3.根据权利要求1所述的方法,其特征在于,确定每两个所述字段数据是否属于同一用户的权重值的步骤,包括:获取每个所述字段数据所在的字段集以及每个所述字段集所属的目标领域;根据每个所述字段数据所在的字段集和每个所述字段集所属的目标领域,构建语义学习模型;利用所述语义学习模型,确定每两个所述字段数据是否属于同一用户的权重值。4.根据权利要求3所述的方法,其特征在于,所述权重值为正权重值或负权重值,其中,所述正权重值用于指示两个不同数据源的所述字段数据在同一个同义字段集的字段值相同,且该两个所述字段数据属于同一用户;所述负权重值用于指示两个不同数据源的所述字段数据在同一个同义字段集的字段值不相同,且该两个所述字段数据不属于同一用户。5.根据权利要求1所述的方法,其特征在于,根据所述字段值和所述权重值,确定每个用户的连通集合的步骤,包括:对所述字段值和所述权重值进行排序,得到排序结果;...

【专利技术属性】
技术研发人员:王晓鹏
申请(专利权)人:北京品友互动信息技术股份公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1