一种页面访问上下游流量的计算方法技术

技术编号：27975907 阅读：30 留言：0更新日期：2021-04-06 14:10

本发明专利技术属于大数据分析技术领域，涉及一种页面访问上下游流量的计算方法，步骤为：获取用户的访问日志数据并进行存储；离线分析系统读取并解析访问日志数据，还原用户访问路径树，将其写入存储系统中的数据表中；即席分析系统根据查询条件，读取并匹配用户的访问树，返回页面的上下游流量数据。本发明专利技术通过访问路径计算规则将无结构、乱序的访问日志转化为用户完整的访问路径的树状结构，从而支持多样的查询匹配条件，数据更加准确避免数据的重复匹配；通过对树状结构序列化的存储方式，在不丢失访问信息的保证下，由链接树字典单元块加速查询匹配效率，而访问树单块元的序列化方式极大方便路径检索算法实现，能够提供给定访问路径并匹配的能力。

全部详细技术资料下载

【技术实现步骤摘要】
一种页面访问上下游流量的计算方法
本专利技术属于大数据分析
，涉及一种页面访问上下游流量的计算方法。
技术介绍
通过用户访问网站留下的访问日志，分析页面的访问情况以及给下游页面的流量转化情况是每个公司的基本运营关注指标，基于这些数据可调整页面布局等手段最大化用户访问留存和调整流量分配。目前存在的问题是，直接查询访问日志计算的方案复杂繁琐，而市面上存在的众多分析服务也仅能满足基本的数据需求，无法很好匹配公司的业务情况以及分析需要，尤其是市面的分析服务计算上下游流量算法，当用户的访问路径中存在多个匹配时都会全部算入，存在重复统计问题，不能反映出流量逐层递减的数据指标，而且无法满足匹配给定一条页面访问路径的流量情况的分析需要。
技术实现思路
本专利技术针对上述的问题，提供了一种页面访问上下游流量的计算方法。为了达到上述目的，本专利技术采用的技术方案为，一种页面访问上下游流量的计算方法，具体步骤如下：1)获取用户的访问日志数据并进行存储；2)离线分析系统读取并解析访问...

【技术保护点】
1.一种页面访问上下游流量的计算方法，其特征在于，/n具体步骤如下：/n1)获取用户的访问日志数据并进行存储；/n2)离线分析系统读取并解析访问日志数据，还原用户访问路径树，并将其写入存储系统中的数据表中；/n3)即席分析系统根据查询条件，读取并匹配用户的访问树，返回页面的上下游流量数据。/n

【技术特征摘要】
1.一种页面访问上下游流量的计算方法，其特征在于，
具体步骤如下：
1)获取用户的访问日志数据并进行存储；
2)离线分析系统读取并解析访问日志数据，还原用户访问路径树，并将其写入存储系统中的数据表中；
3)即席分析系统根据查询条件，读取并匹配用户的访问树，返回页面的上下游流量数据。

2.根据权利要求1所述的一种页面访问上下游流量的计算方法，其特征在于，所述访问日志数据包括访问时间、用户标识ID、会话ID、当前页面链接、来源页面链接。

3.根据权利要求2所述的一种页面访问上下游流量的计算方法，其特征在于，所述步骤2)为：离线分析系统读取并解析访问日志数据，基于日志信息按照路径计算规则还原用户的访问路径树，并将访问树序列化后与其他用户信息写入到存储系统中的数据表中。

4.根据权利要求3所述的一种页面访问上下游流量的计算方法，其特征在于，所述路径计算规则包括以下步骤：读取访问日志，并按用户标识ID，会话ID分组；对分组内数据按照访问时间做升序排序；按顺序遍历，根据当前页面访问日志的来源页面链接，回溯查找该来源页面在时间上最近一次访问的记录，若查找到，则将当前页面标记为该来源页面的下游并存储到特定的数据结构，否则标记为新的访问入口，直至遍历完全部记录。

5.根据权利要求4所述的一种页面访问上下游流量的计算方法，其特征在于，所述即席分析系...

【专利技术属性】
技术研发人员：刘家锹，
申请(专利权)人：广州凡科互联网科技股份有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人