一种日志处理方法、装置及设备制造方法及图纸

技术编号:23484877 阅读:24 留言:0更新日期:2020-03-10 12:34
本申请提供一种日志处理方法、装置及设备,该方法包括:获取第一日志集合,所述第一日志集合包括多个原始日志;根据所述原始日志的数据模式对第一日志集合中的原始日志进行处理,得到第二日志集合,所述第二日志集合包括多个模式日志;根据所述原始日志的跟踪标识对第一日志集合中的原始日志进行处理,得到第三日志集合,所述第三日志集合包括多个跟踪日志;根据所述跟踪日志对第二日志集合中的模式日志进行处理,得到第四日志集合,所述第四日志集合包括多个目标日志,所述多个目标日志的数量小于所述多个原始日志的数量。通过本申请的技术方案,可以将大量原始日志处理为少量的目标日志,实现原始日志的压缩与处理,减少日志的数量。

A log processing method, device and equipment

【技术实现步骤摘要】
一种日志处理方法、装置及设备
本申请涉及互联网
,尤其是一种日志处理方法、装置及设备。
技术介绍
随着互联网技术的快速发展,日志数据越来越重要,用户行为日志是一种重要的日志数据,通过分析用户行为日志可以提高服务质量,提供个性化服务。其中,用户行为是指用户在网站或者APP(应用程序)的操作行为,如注册、登录、商品搜索、页面浏览、视频观看、商品购买、页面收藏、添加购物车、商品下单、商品支付、评论等等。通过采集用户行为日志,就可以分析出用户行为,继而根据用户行为向用户提供个性化服务,从而提高服务质量。针对用户的所有操作行为,均需要采集用户行为日志,且每个操作行为均可能产生大量用户行为日志,例如,用户的一次登录行为,可能产生几百个用户行为日志,因此,上述方式会导致采集到大量用户行为日志。为了分析用户行为,可以将这些用户行为日志均显示给业务人员,由业务人员从大量用户行为日志中选择有价值的用户行为日志,并根据用户行为日志分析用户行为。显然,在上述方式中,需要从大量的用户行为日志中选择有价值的用户行为日志,其工作量比较大,业务体本文档来自技高网...

【技术保护点】
1.一种日志处理方法,其特征在于,所述方法包括:/n获取第一日志集合,所述第一日志集合包括多个原始日志;/n根据所述原始日志的数据模式对所述第一日志集合中的原始日志进行处理,得到第二日志集合,所述第二日志集合包括多个模式日志;/n根据所述原始日志的跟踪标识对所述第一日志集合中的原始日志进行处理,得到第三日志集合,所述第三日志集合包括多个跟踪日志;/n根据所述跟踪日志对所述第二日志集合中的模式日志进行处理,得到第四日志集合,所述第四日志集合包括多个目标日志,所述多个目标日志的数量小于所述多个原始日志的数量。/n

【技术特征摘要】
1.一种日志处理方法,其特征在于,所述方法包括:
获取第一日志集合,所述第一日志集合包括多个原始日志;
根据所述原始日志的数据模式对所述第一日志集合中的原始日志进行处理,得到第二日志集合,所述第二日志集合包括多个模式日志;
根据所述原始日志的跟踪标识对所述第一日志集合中的原始日志进行处理,得到第三日志集合,所述第三日志集合包括多个跟踪日志;
根据所述跟踪日志对所述第二日志集合中的模式日志进行处理,得到第四日志集合,所述第四日志集合包括多个目标日志,所述多个目标日志的数量小于所述多个原始日志的数量。


2.根据权利要求1所述的方法,其特征在于,
所述根据所述原始日志的数据模式对所述第一日志集合中的原始日志进行处理,得到第二日志集合之前,所述方法还包括:
将所述原始日志的日志原文中的可变化参数调整为设定参数;
将调整后的日志原文确定为所述原始日志的数据模式。


3.根据权利要求1或2所述的方法,其特征在于,根据所述原始日志的数据模式对所述第一日志集合中的原始日志进行处理,得到第二日志集合,包括:
从所述第一日志集合中确定具有相同数据模式的原始日志;
对具有相同数据模式的原始日志进行处理,得到处理后的日志;
将所述第一日志集合中剩余的日志确定为模式日志;
将由所述模式日志组成的集合确定为所述第二日志集合。


4.根据权利要求3所述的方法,其特征在于,
所述对具有相同数据模式的原始日志进行处理,得到处理后的日志,包括:
保留所述具有相同数据模式的所有原始日志中的一个原始日志;
去除所述具有相同数据模式的所有原始日志中的其它原始日志。


5.根据权利要求1所述的方法,其特征在于,
所述根据所述原始日志的跟踪标识对所述第一日志集合中的原始日志进行处理,得到第三日志集合之前,所述方法还包括:
从所述原始日志的上下文信息中获取所述原始日志的跟踪标识。


6.根据权利要求1或5所述的方法,其特征在于,根据所述原始日志的跟踪标识对所述第一日志集合中的原始日志进行处理,得到第三日志集合,包括:
从所述第一日志集合中确定具有相同跟踪标识的原始日志;
对具有相同跟踪标识的原始日志进行处理,得到处理后的日志;
将所述第一日志集合中剩余的日志确定为跟踪日志;
将由所述跟踪日志组成的集合确定为所述第三日志集合。


7.根据权利要求6所述的方法,其特征在于,
所述对具有相同跟踪标识的原始日志进行处理,得到处理后的日志,包括:
将具有相同跟踪标识的所有原始日志重组为同一日志。


8.根据权利要求1所述的方法,其特征在于,所述根据所述跟踪日志对所述第二日志集合中的模式日志进行处理,得到第四日志集合,包括:
根据所述模式日志的跟踪标识与所述跟踪日志的跟踪标识,从所述第三日志集合中确定与所述模式日志对应的跟踪日志;
根据所述第二日志集合中的模式日志对应的跟踪日志,对所述第二日志集合中的模式日志进行处理,得到处理后的日志;
将所述第二日志集合中剩余的日志确定为目标日志;
将由所述目标日志组成的集合确定为所述第四日志集合。


9.根据权利要求8所述的方法,其特征在于,
所述根据所述模式日志的跟踪标识与所述跟踪日志的跟踪标识,从所述第三日志集合中确定与所述模式日志对应的跟踪日志,包括:
针对第二日志集合中的模式日志,若跟踪日志的跟踪标识与所述模式日志的跟踪标识相同,则将所述跟踪日志确定为与所述模式日志对应的跟踪日志。


10.根据权利要求8所述的方法,其特征在于,
所述根据所述第二日志集合中的模式日志对应的跟踪日志,对所述第二日志集合中的模式日志进行处理,得到处理后的日志,包括:
针对第二日志集合中的模式日志,若至少两个模式日志对应的跟踪日志相同,则将所述至少两个模式日志重组为同一个日志,得到重组后的日志。


11.根据权利要求10所述的方法,其特征在于,
将所述至少两个模式日志重组为同一个日志,得到重组后的日志,包括:
在...

【专利技术属性】
技术研发人员:李国忠
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1