【技术实现步骤摘要】
流量数据处理方法、装置、设备及存储介质
[0001]本申请实施例涉及大数据
,尤其涉及一种流量数据处理方法、装置、设备及存储介质。
技术介绍
[0002]随着互联网电商行业的迅速发展以及各类线上应用本身的业务丰富度不断提升,用户可以从线上应用的各个入口进入任务页面,然后通过埋点记录的用户行为路径,分析用户下单路径上的卡点,进而完善产品体验。
[0003]现有技术中,用户行为路径的分析方法是根据每个任务页面的“上一页面”标识,得到单一任务页面的来源,然后针对单一任务页面,可以按预设维度(例如,以天为维度)统计每个任务页面的页面访问量(page view,UV)和用户的整体订单信息,从而计算获得用户行为路径的转化数据。
[0004]在实现本专利技术过程中,专利技术人发现现有技术中至少存在如下问题:由于用户的线上行为具有随机性,根据每个任务页面的“上一页面”标识得到单一页面来源的方式无法区分入口来源,导致无法进行完整的转化路径分析,存在页面流量分析精度低的问题。
技术实现思路
[0005]本申请实施例提供一种流量数据处理方法、装置、设备及存储介质,用以解决用户行为路径分析方法存在的页面流量分析精度低的问题。
[0006]根据本申请的第一方面,本申请实施例提供一种流量数据处理方法,包括:
[0007]获取第一用户行为日志集,所述第一用户行为日志集中的每条第一用户行为日志均携带有用户设备号、行为时间信息和渠道参数信息;
[0008]对所述第一用户行为日志集中的每条用 ...
【技术保护点】
【技术特征摘要】
1.一种流量数据处理方法,其特征在于,包括:获取第一用户行为日志集,所述第一用户行为日志集中的每条第一用户行为日志均携带有用户设备号、行为时间信息和渠道参数信息;对所述第一用户行为日志集中的每条用户行为日志进行分析,确定出多个第一用户行为日志子集,每个第一用户行为日志子集中的每条第一用户行为日志的行为时间信息和渠道参数信息均相同;针对每个第一用户行为日志子集,根据所述第一用户行为日志子集中每条第一用户行为日志携带的用户设备号,确定多个预设对象的流量信息;根据所述多个预设对象的流量信息,确定不同渠道参数对应的流量归类信息。2.根据权利要求1所述的方法,其特征在于,所述第一用户行为日志子集为第一用户浏览日志集,所述第一用户浏览日志集中的每条第一用户浏览日志还携带有页面标识;相应的,所述根据所述第一用户行为日志子集中每条第一用户行为日志携带的用户设备号,确定多个预设对象的流量信息,包括:根据所述第一用户浏览日志集中每条第一用户浏览日志携带的页面标识,确定出多个预设对象,所述多个预设对象包括:入口页面和至少一个核心页面;根据所述第一用户浏览日志集中每条第一用户浏览日志携带的用户设备号,确定所述入口页面的独立访客量和每个核心页面的独立访客量。3.根据权利要求1所述的方法,其特征在于,所述第一用户行为日志子集为第一用户下单日志集,所述第一用户下单日志集中的每条第一用户下单日志还携带有订单号;相应的,所述根据所述第一用户行为日志子集中每条第一用户行为日志携带的用户设备号,确定多个预设对象的流量信息,包括:根据所述第一用户下单日志集中每条第一用户下单日志携带的用户设备号,确定出下单独立访客量;根据所述第一用户行为日志子集中每条第一用户下单日志携带的订单号,确定出下单量。4.根据权利要求1
‑
3任一项所述的方法,其特征在于,所述方法还包括:获取第二用户行为日志集,所述第二用户行为日志集中的每条第二用户行为日志均携带有用户设备号、页面标识和行为时间信息;基于预设渠道处理策略对每条第二用户行为日志进行处理,确定每条第二用户行为日志的渠道参数信息;针对每条第二用户行为日志,利用所述第二用户行为日志的渠道参数信息更新所述第二用户行为日志,得到所述第二用户行为日志对应的第一用户行为日志;存储所述第二用户行为日志集中每条第二用户行为日志对应的第一用户行为日志。5.根据权利要求4所述的方法,其特征在于,所述第二用户行为日志集包括:携带渠道类型信息的第二用户浏览日志集,所述渠道类型信息用于表示当前第二用户浏览日志的页面是否为产品线的入口页面;相应的,所述基于预设渠道处理策略对每条第二用户行为日志进行处理,确定每条第二用户行为日志的渠道参数信息,包括:针对所述第二用户浏览日志集中的每条第二用户浏览日志,执行如下操作:
根据所述第二用户浏览日志携带的渠道类型信息,判断所述第二用户浏览日志是否携带渠道参数信息;若是,标记所述第二用户浏览日志对应的页面为产品线的入口页面;若否,在所述第二用户浏览日志携带的浏览时间所在的周期内,判断所述浏览时间之前是否存在目标浏览日志,所述目标浏览日志携带有渠道参数信息,且所述目标浏览日志与所述第二用户浏览日志携带的用户设备号相同;在所述浏览时间之前存在多个目标浏览日志时,在所述多个目标浏览日志中,确定出距离所述浏览时间最近的目标浏览日志;将距离所述浏览时间最近的目标浏览日志携带的渠道参数信息写入所述第二用户浏览日志;在所述浏览时间之前不存在目标浏览日志时,确定所述第二用户浏览日志的渠道参数信息为空值,并将空值的渠道参数信息写入所述第二用户浏览日志。6.根据权利要求4所述的方法,其特征在于,所述第二用户行为日志集包括:第二用户下单日志集;相应的,所述基于预设渠道处理策略对每条第二用户行为日志进行处理,确定每条第二用户行为日志的渠道参数信息,包括:针对所述第二用户下单日志集中的每条第二用户下单日志,执行如下操作:在所述第二用户下单日志携带的下单时间所在的周期内,判断所述下单时间之前是否存在目标浏览日志,所述目标浏览日志携带有渠道参数信息,且所述目标浏览日志与所述第二用户下单日志携带的用户设备号相同;在所述下单时间之前存在多个目标浏览日志时,在所述多个目标浏览日志中,确定出距离所述下单时间最近的目标浏览日志;将距离所述下单时间最近的目标浏览日志携带的渠道参数信息写入所述第二用户下单日志;在所述下单时间之前不存在目标浏览日志时,确定所述第二用户下单日志的渠道参数信息为空值,并将空值的渠道参数信息写入所述第二用户下单日志。7.根据权利要求4所述的方法,其特征在于,所述方法还包括:确定产品线的各个页面埋设有监控点以及所述产品线的入口页面位置设置有渠道参数,所述渠道参数用于标识渠道来源信息。8.一种流量数据处理装置,其特征在于,包括:获取模块,用于获取第一用户行为日志集,所述第一用户行为日志集中的每条第一用户行为日志均携带有用户设备号、行为时间信息和渠道参数信息;分集模...
【专利技术属性】
技术研发人员:曲悦,
申请(专利权)人:北京京东拓先科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。