【技术实现步骤摘要】
访问数据统计方法、装置、计算机设备和存储介质
[0001]本申请涉及计算机
,特别是涉及一种访问数据统计方法、装置、计算机设备和存储介质。
技术介绍
[0002]随着计算机技术的快速发展,计算机设备每时每刻都需要运行庞大的数据,例如对象的请求数据、浏览数据、验证数据等,因此出现了对海量数据的统计技术。通过数据统计技术,能够对海量数据在各方面的分布情况进行统计分析,以便后续对数据进行调用或者查询等。
[0003]传统的数据统计方式,需要确定待统计的海量数据对应的数值范围,根据数值范围的上限值和预设的统计误差,确定上限值落在的统计区间的组距,再根据组距和统计误差,按预设的组距策略将数值范围划分为至少两个统计区间,以及确定每个统计区间所采用的直方图的组数,将每个海量数据统计在对应的统计区间的直方图中。然而,这种数据统计方式需要使用庞大的计算资源进行处理,处理效率较低。
技术实现思路
[0004]基于此,有必要针对上述技术问题,提供一种能够提高处理效率的访问数据统计方法、装置、计算机设备和存储介质。r/>[0005]一本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种访问数据统计方法,其特征在于,所述方法包括:获取对目标资源进行访问所得到的访问数据;基于所述访问数据确定与所述目标资源对应的访问量;当所述访问量满足海量访问条件时,将每个所述访问数据分别转换为对应的哈希数据;所述哈希数据包括哈希编号和哈希值;将各所述哈希值分配至与相应哈希编号相关联的桶空间中;根据各所述桶空间所包括的哈希值进行基数预估处理,得到与所述目标资源对应的访问统计结果。2.根据权利要求1所述的方法,其特征在于,所述访问数据包括对象标识和访问标识;所述获取对目标资源进行访问所得到的访问数据,包括:获取在预设时间段内对应于目标资源的日志数据;从所述日志数据中获取对所述目标资源进行访问的对象标识,以及对所述目标资源所发送的访问请求对应的访问标识。3.根据权利要求2所述的方法,其特征在于,所述基于所述访问数据确定与所述目标资源对应的访问量,包括:在聚合算子上生成对象集合和访问集合;将各所述对象标识写入所述对象集合,并将所述访问标识写入所述访问集合;在每次写入对象标识和访问标识后,基于所述对象集合中的对象标识,统计访问所述目标资源的对象量,并基于所述访问集合中的访问标识,统计所述目标资源被访问的被访问量。4.根据权利要求1所述的方法,其特征在于,在所述基于所述访问数据确定与所述目标资源对应的访问量之后,还包括:当所述访问量满足海量访问条件时,创建预设长度的数组,并将所述数组划分为多个桶空间;所述将各所述哈希值分配至与相应哈希编号相关联的桶空间中,包括:通过各所述哈希数据中的哈希编号对所述多个桶空间进行编号,并将各所述哈希值分配至与相应哈希编号所对应的桶空间中。5.根据权利要求4所述的方法,其特征在于,所述通过各所述哈希数据中的哈希编号对所述多个桶空间进行编号,包括:从所述哈希数据的首位数值起,将预设位数的数值作为哈希编号,并将所述预设位数之后的数值作为哈希值;通过各所述哈希编号对所述多个桶空间进行编号。6.根据权利要求1所述的方法,其特征在于,所述根据各所述桶空间所包括的哈希值进行基数预估处理,得到与所述目标资源对应的访问统计结果,包括:确定各所述桶空间的每个哈希值中首次出现预设数值的数值位置,并基于各所述数值位置确定与所述目标资源对应的访问统计结果。7.根据权利要求6所述的方法,其特征在于,所述访问数据包括对象标识和访问标识;所述确定各所述桶空间的每个哈希值中首次出现预设数值的数值位置,并基于各所述数值位置确定与所述目标资源对应的访问统计结果,包括:
确定对象标识对应的各桶空间中每个哈希值首次出现的预设数值在相应的哈希值中的第一数值位置;基于各所述第一数值位置,确定访问所述...
【专利技术属性】
技术研发人员:石志林,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。