The invention discloses a data analysis method, device, computing device and computer storage medium for ID data network, in which the data analysis method of ID data network includes: acquiring an ID data network containing ID data and the association relationship between ID data; ID data includes user ID data and/or device ID data; according to the ID data contained in the ID data network and the correlation between ID data. The system constructs ID relational data; the ID relational data includes several pairs of ID relational data; compares and combines the ID relational data, and obtains several ID data subnets. This technical scheme effectively improves the data analysis efficiency of ID data network, can accurately and quickly obtain several ID data subnets, and realize the effective division of ID data network. Compared with ID data network, the ID data contained in ID data subnet has a strong and reliable correlation relationship, can be identified as the same user's ID data, and is helpful to build a complete and effective user portrait.
【技术实现步骤摘要】
ID数据网数据分析方法、装置及计算设备
本专利技术涉及互联网
,具体涉及一种ID数据网数据分析方法、装置、计算设备及计算机存储介质。
技术介绍
为了满足用户不同的使用需求,人们已开发了上网、购物、订餐、订火车票、支付等多个业务可供用户选择与使用。业务会根据用户在业务中的账号或者用户所使用的设备等,为用户设置ID数据,用于对用户进行标识。可根据来自于多个业务的ID数据,构造ID数据网,基于ID数据网能够对用户性别、用户年龄、浏览喜好、点击喜好、活跃度、物品购买喜好、物品购买潜力、游戏喜好等用户特征进行分析,构建完整、有效的用户画像,以实现对新闻、游戏、广告等的精准推荐。然而多个业务的ID数据繁多,ID数据之间的关联关系复杂,数据处理量较大,且不同业务对于ID数据的设置规则不同,无法准确、快速地从ID数据网所包含的大量的ID数据中识别出对应于同一用户的ID数据。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的ID数据网数据分析方法、装置、计算设备及计算机存储介质。根据本专利技术的一个方面,提供了一种ID数据网数据分析方法,该方法包括:获取包含ID数据以及ID数据之间的关联关系的ID数据网;ID数据包括:用户ID数据和/或设备ID数据;根据ID数据网所包含的ID数据以及ID数据之间的关联关系,构建ID关系数据;ID关系数据包括数个ID关系对;对ID关系数据进行比对组合,得到数个ID数据子网。进一步地,对ID关系数据进行比对组合,得到数个ID数据子网进一步包括:全量复制ID关系数据至内存中;将ID关系数据与全量复 ...
【技术保护点】
1.一种ID数据网数据分析方法,所述方法包括:获取包含ID数据以及ID数据之间的关联关系的ID数据网;所述ID数据包括:用户ID数据和/或设备ID数据;根据所述ID数据网所包含的ID数据以及ID数据之间的关联关系,构建ID关系数据;所述ID关系数据包括数个ID关系对;对所述ID关系数据进行比对组合,得到数个ID数据子网。
【技术特征摘要】
1.一种ID数据网数据分析方法,所述方法包括:获取包含ID数据以及ID数据之间的关联关系的ID数据网;所述ID数据包括:用户ID数据和/或设备ID数据;根据所述ID数据网所包含的ID数据以及ID数据之间的关联关系,构建ID关系数据;所述ID关系数据包括数个ID关系对;对所述ID关系数据进行比对组合,得到数个ID数据子网。2.根据权利要求1所述的方法,其中,所述对所述ID关系数据进行比对组合,得到数个ID数据子网进一步包括:全量复制所述ID关系数据至内存中;将所述ID关系数据与全量复制到内存中的ID关系数据进行比对组合,根据比对组合结果进行数据整合,得到数个ID数据子网。3.根据权利要求2所述的方法,其中,所述将所述ID关系数据与全量复制到内存中的ID关系数据进行比对组合,根据比对组合结果进行数据整合,得到数个ID数据子网进一步包括:将所述ID关系数据划分为多个分片;将多个分片并行地与全量复制到内存中的ID关系数据进行比对组合,得到所有分片的比对组合结果;将所有分片的比对组合结果进行数据整合,得到数个ID数据子网。4.根据权利要求3所述的方法,其中,所述将多个分片并行地与全量复制到内存中的ID关系数据进行比对组合,得到所有分片的比对组合结果进一步包括:针对任一分片,将该分片与全量复制到内存中的ID关系数据进行比对组合,得到该分片的比对组合中间结果;迭代执行本步骤,直至符合预设迭代条件:将所有分片的比对组合中间结果划分为多个中间子分片,并将多个中间子分片并行地与全量复制到内存中的ID关系数据进行比对组合,得到下一次迭代运行的所有分片的比对组合中间结果;迭...
【专利技术属性】
技术研发人员:李晓明,王斌锋,马征,
申请(专利权)人:北京奇虎科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。