【技术实现步骤摘要】
数据处理方法、装置、电子设备和计算机可读存储介质
[0001]本申请涉及数据处理
,具体涉及一种数据处理方法、装置、电子设备和计算机可读存储介质。
技术介绍
[0002]随着互联网的发展,使用互联网的用户越来越多。为了更好地服务用户,一般会对用户的行为数据进行统计分析。
[0003]目前,当对用户进行分析时,会统计与用户的相邻用户的行为数据,并将相邻用户的行为数据的统计结果作为用户的特征。因此,当获取到一条用户行为数据时,会获取该用户行为数据对应的用户的相邻用户的行为数据,然后进行统计。该方法需要存储所有用户的相邻用户的行为数据,导致需要消耗的大量的缓存。
技术实现思路
[0004]本申请实施例提供一种数据处理方法、装置、电子设备和计算机可读存储介质,可以解决需要消耗的大量的缓存的技术问题。
[0005]一种数据处理方法,包括:
[0006]获取原始数据,并对上述原始数据进行划分,得到多块行为数据;
[0007]从上述多块行为数据中筛选出相邻的候选块行为数据;
[0008]获取上述候选块行为数据中的目标用户的候选相邻用户的行为数据,生成上述目标用户与上述候选相邻用户的行为数据之间的映射关系,并将上述映射关系存储于缓存中;
[0009]从上述多块行为数据中筛选出除了上述候选块行为数据之外的相邻的后续块行为数据;
[0010]获取上述后续块行为数据的后续用户的后续相邻用户的行为数据,并将上述后续用户与上述后续相邻用户的行为数据替换上述映射关系中 ...
【技术保护点】
【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:获取原始数据,并对所述原始数据进行划分,得到多块行为数据;从所述多块行为数据中筛选出相邻的候选块行为数据;获取所述候选块行为数据中的目标用户的候选相邻用户的行为数据,生成所述目标用户与所述候选相邻用户的行为数据之间的映射关系,并将所述映射关系存储于缓存中;从所述多块行为数据中筛选出除了所述候选块行为数据之外的相邻的后续块行为数据;获取所述后续块行为数据的后续用户的后续相邻用户的行为数据,并将所述后续用户与所述后续相邻用户的行为数据替换所述映射关系中的所述目标用户与所述候选相邻用户的行为数据。2.根据权利要求1所述的数据处理方法,其特征在于,所述相邻的候选块行为数据包括第一块行为数据和第二块行为数据,所述相邻的后续块行为数据包括第三块行为数据和第四块行为数据;相应地,所述获取所述候选块行为数据中的目标用户的候选相邻用户的行为数据,生成所述目标用户与所述候选相邻用户的行为数据之间的映射关系,并将所述映射关系存储于缓存中,包括:获取所述第一块行为数据中的第一目标用户的第一候选相邻用户的行为数据,并生成所述第一目标用户与所述第一候选相邻用户的行为数据之间的第一映射关系;获取所述第二块行为数据中的第二目标用户的第二候选相邻用户的行为数据,并生成所述第二目标用户与所述第二候选相邻用户的行为数据之间的第二映射关系;将所述第一映射关系和所述第二映射关系存储于所述缓存中;所述获取所述后续块行为数据的后续用户的后续相邻用户的行为数据,并将所述后续用户与所述后续相邻用户的行为数据替换所述映射关系中的所述目标用户与所述候选相邻用户的行为数据,包括:获取所述第三块行为数据中的第一后续用户的第一后续相邻用户的行为数据,以及获取所述第四块行为数据中的第二后续用户的第二后续相邻用户的行为数据;将第一后续用户与第一后续相邻用户的行为数据替换所述第一映射关系中的第一目标用户与所述第一候选相邻用户的行为数据;将第二后续用户与第二后续相邻用户的行为数据替换所述第二映射关系中的第二目标用户与所述第二候选相邻用户的行为数据。3.根据权利要求1所述的数据处理方法,其特征在于,所述获取所述候选块行为数据中的目标用户的候选相邻用户的行为数据,包括:将所述候选块行为数据划分为各个候选子块行为数据,各个所述候选子块行为数据的数量之间的差值在预设数值区间内;每次向外部数据库获取一块所述候选子块行为数据的目标用户的候选相邻用户的行为数据,直至所述候选块行为数据的目标用户的候选相邻用户的行为数据获取完成。4.根据权利要求3所述的数据处理方法,其特征在于,所述将所述候选块行为数据划分为各个候选子块行为数据,包括:采用一致性哈希算法,将所述候选块行为数据划分为各个候选子块行为数据。
5.根据权利要求1所述的数据处理方法,其特征在于,所述映射关系为状态管理函...
【专利技术属性】
技术研发人员:石志林,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。