网站流量分析方法、装置和电子设备制造方法及图纸

技术编号:12910332 阅读:47 留言:0更新日期:2016-02-24 16:00
一种网站流量分析方法、装置和电子设备,网站流量分析方法包括:获取网站访问日志;过滤并处理访问日志,得到具备用户标识信息的网站域名信息;对用户标识信息进行分组,并对分组后的用户标识信息和网站域名信息按照访问时间顺序进行排序;根据时间阈值对排序后的所述网站域名信息进行切割,得到所有用户的第一访问路径;对所述第一访问路径进行去重处理,得到第二访问路径;筛选出包含待分析网站的所有所述第二访问路径,并根据所述第二访问路径相关信息得到以所述待分析网站为基点的任一指定路径的访问用户数量。网站流量分析方法通过统计待分析网站的第二访问路径及访问用户数量,有效的分析网站外部流量的来源去向。

【技术实现步骤摘要】

本专利技术涉及一种数据统计方法,尤其涉及一种网站流量分析方法、装置和电子设 备。
技术介绍
随着科学技术的快速发展,互联网技术日新月异,互联网数据爆发式地增长。网站 流量是指网站的访问量,可以用一个网站一段时间内访问者的数量、访问者所浏览的网页 的点击率和平均停留时间等指标来描述。网站流量和客户群体以及他们的需求被越来越多 的人重视。网站流量统计分析,是指在获得网站访问量基本数据的情况下,对有关数据进 行统计、分析,掌握网站流量趋势、洞察访客行为习惯。通过网站流量统计分析可以直观的 了解网站用户群的大小、地域分布、网站内容的关注度、网站来源、用户在访问过的每个页 面上的鼠标事件(点击、滑过)以及关注内容区域分布及所关注时间长短,页面浏览高度、 位置等信息,以了解网站当前的访问效果和访问用户行为并发现当前网络活动中存在的问 题,并为进一步修正或重新制定网络营销策略提供依据。 现有技术中,网站通过收集用户的访问日志,并从日志中提取用户的访问行为信 息进行统计和分析。利用refer信息将用户的访问动作进行串联,并对串联的路径进行规 整,最终生成用户访问网站的路径树,并结合各种维度进行分析展现。从这些访问日志中, 网站可以根据各种维度统计各类指标来辅助网站运营。其中,关键统计内容就是根据网站 访问日志统计用户在网站内的访问路径,从而跟踪用户在网站内的访问情况,发现问题并 提升和优化网站的用户体验。 但是,现有技术中的网站流量分析方法是针对网站内的用户访问路径的统计,无 法分析网站外部的流量的来源和去向,即进入网站前流量的来源以及离开网站后流量的去 向;而且网站用户访问路径是使用网站自身的cookie,S卩,储存在用户本地终端上的数据 或注册账号的ID,所述ID仅限于网站自身对用户的标识,无法有效识别外部流量中的同一 用户,无法为网站的流量引入和用户流失提供具备参考意义的数据。
技术实现思路
本专利技术解决的技术问题是如何有效的统计和分析网站外部流量。 为解决上述技术问题,本专利技术实施例提供一种网站流量分析方法,所述网站流量 分析方法包括: 获取网站访问日志; 过滤并处理所述访问日志,得到具备用户标识信息的网站域名信息; 对所述用户标识信息进行分组,并对分组后的所述用户标识信息和所述网站域名 信息按照访问时间顺序进行排序; 根据时间阈值对排序后的所述网站域名信息进行切割,得到所有用户的第一访问 路径; 对所述第一访问路径进行去重处理,得到第二访问路径; 筛选出包含待分析网站的所有所述第二访问路径,并根据所述第二访问路径相关 信息得到以所述待分析网站为基点的任一指定路径的访问用户数量。 可选的,所述网站流量分析方法还包括:根据所述待分析网站的所有所述第二访 问路径和所述访问用户数量生成分析图表。 可选的,所述过滤并处理所述访问日志,得到具备用户标识信息的网站域名信息 包括:过滤所述访问日志,得到所述用户标识信息和所述网站域名信息;并根据黑名单或 白名单的方式过滤所述网站域名信息。 可选的,所述过滤所述访问日志后,还得到访问时间值和URL信息。 可选的,所述对所述用户标识信息进行分组,并对分组后的所述用户标识信息和 所述网站域名信息按照访问时间顺序进行排序,包括:首先对所述分组后的所述用户标识 信息按照所述访问时间顺序进行排序,再对所述网站域名信息按照所述访问时间顺序进行 排序。 可选的,根据设定步骤阈值截取包括所述待分析网站的所有所述第二访问路径, 得到第三访问路径,并根据所述第三访问路径得到以所述待分析网站为基点的任一指定路 径的所述访问用户数量。 可选的,所述访问日志包括站内访问日志和站外访问日志。 可选的,所述用户标识信息包括以下一种或多种:IP和UserAgent、C〇〇kieID信 息和设备唯一标识号。 为解决上述技术问题,本专利技术实施例还公开了一种网站流量分析装置,所述网站 流量分析装置包括: 采集单元,获取网站访问日志; 数据处理单元,适于过滤并处理所述访问日志,得到具备用户标识信息的网站域 名信息; 排序单元,对所述用户标识信息进行分组,并对分组后的所述用户标识信息和所 述网站域名信息按照访问时间顺序进行排序; 路径切割单元,适于根据时间阈值对排序后的所述网站域名信息进行切割,得到 所有用户的第一访问路径; 路径去重单元,适于对所述第一访问路径进行去重处理,得到第二访问路径; 流量统计单元,适于筛选出包含待分析网站的所有所述第二访问路径,并根据所 述第二访问路径相关信息得到以所述待分析网站为基点的任一指定路径的访问用户数量。 可选的,所述网站流量分析装置,还包括:图表生成单元,适于根据所述待分析网 站的所有所述第二访问路径和所述访问用户数量生成分析图表。 为解决上述技术问题,本专利技术实施例还公开了一种电子设备,所述电子设备包括 所述网站流量分析装置。 与现有技术相比,本专利技术实施例的技术方案具有以下有益效果: 本专利技术实施例通过采集网站访问日志,从而确保能得到与待分析网站外部流量相 关的信息;过滤并处理所述访问日志,得到具备用户标识信息的网站域名信息,从而可以减 少待处理的数据量,提升数据处理效率,降低数据处理资源的无谓消耗;通过所述用户标识 信息可以将不同网站信息进行串联;对所述用户标识信息进行分组,并对分组后的所述用 户标识信息和所述网站域名信息按照访问时间顺序进行排序,根据时间阈值对排序后的所 述网站域名信息进行切割,得到所有用户的第一访问路径,从而可以客观地反映各用户进 行网站访问的物理情况;对所述第一访问路径进行去重处理,得到第二访问路径,通过时间 阈值切割和去重处理,得到有效的同一用户访问不同网站的路径。筛选出包含待分析网站 的所有所述第二访问路径,并根据所述第二访问路径相关信息得到以所述待分析网站为基 点的任一指定路径的访问用户数量。本专利技术实施例通过以物理数据指示的包含在待分析网 站的第二访问路径中的客观存在的相关信息,高效率且低资源消耗地识别待分析网站外部 流量中的同一用户,为待分析网站的流量引入和用户流失提供具备参考意义的数据。【附图说明】 图1是本专利技术实施例一种网站流量分析方法流程图; 图2是本专利技术实施例一种网站流量分析图表示意图; 图3是本专利技术实施例一种网站流量分析装置结构示意图。【具体实施方式】 如
技术介绍
中所述,现有技术中的网站流量分析方法是针对网站内的用户访问路 径的统计,无法分析网站外部的流量的来源和去向,即进入网站前流量的来源以及离开网 站后流量的去向;而且网站用户访问路径是使用网站自身的cookie,S卩,储存在用户本地 终端上的数据或注册账号的ID,所述ID仅限于网站自身对用户的标识,无法有效识别外部 流量中的同一用户,无法为网站的流量引入和用户流失提供具备参考意义的数据。 本专利技术实施例通过采集网站访问日志,从而确保能得到与待分析网站外部流量相 关的信息;过滤并处理所述访问日志,得到具备用户标识信息的网站域名信息,从而可以减 少待处理的数据量,提升数据处理效率,降低数据处理资源的无谓消耗;通过所述用户标识 信息可以将不同网站信息进行串联;对所述用户标识信息进行分组,并对分组后的所述用 户标识信息和所述网站域名信息按照访问时间顺序进行排序,根据时间阈本文档来自技高网
...

【技术保护点】
一种网站流量分析方法,其特征在于,包括:获取网站访问日志;过滤并处理所述访问日志,得到具备用户标识信息的网站域名信息;对所述用户标识信息进行分组,并对分组后的所述用户标识信息和所述网站域名信息按照访问时间顺序进行排序;根据时间阈值对排序后的所述网站域名信息进行切割,得到所有用户的第一访问路径;对所述第一访问路径进行去重处理,得到第二访问路径;筛选出包含待分析网站的所有所述第二访问路径,并根据所述第二访问路径相关信息,得到以所述待分析网站为基点的任一指定路径的访问用户数量。

【技术特征摘要】

【专利技术属性】
技术研发人员:汤奇峰吴盛峰
申请(专利权)人:上海晶赞科技发展有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1