一种网站日志数据处理方法及装置制造方法及图纸

技术编号:12526802 阅读:113 留言:0更新日期:2015-12-17 15:10
本发明专利技术提供了一种网站日志数据处理方法及装置,上述方法包括以下步骤:网站日志数据收集模块根据终端用户访问网站类型,确定数据收集类型并将收集的所述数据收集类型对应的访问数据发送至网站日志数据处理模块;所述网站日志数据处理模块对所述数据收集类型对应的访问数据进行处理后,输出至目标存储区域;实现了对不同类型网站对应的不同访问数据进行有效收集,为网站建设提供了重要数据支撑。

【技术实现步骤摘要】

本专利技术属于日志管理领域,尤其涉及一种网站日志数据处理方法及装置
技术介绍
现有技术中公开了一种网站数据分析方法及分析系统,能够从数据流的角度对全 网数据进行分析。所述方法包括:通过分析网站日志数据,获得访问数据流,所述访问数据 流记录了访问网页的顺序;剔除不包含重要页面的访问数据流,其中,所述重要页面为符合 预定义属性的页面;对剩余的包含重要页面的访问数据流进行频繁挖掘计算,得到出现频 率高的前m个访问数据流及每个访问数据流的出现频度;针对所述m个访问数据流,计算每 个数据流中出现重要页面的次数,以及每个数据流的长度;利用每个访问数据流的出现频 度、出现重要页面的次数和数据流的长度,计算得出所述m个访问数据流中每个数据流的 优质度。 上述方案仅仅揭示了如何对收集的网站日志数据进行分析,但是上述方案并未揭 示如何有效收集网站日志数据。
技术实现思路
为了解决上述技术问题,本专利技术提供了一种网站日志数据处理方法及装置,以解 决上述技术问题。 为了达到本专利技术目的,本专利技术提供了一种网站日志数据处理方法,上述方法包括 以下步骤:网站日志数据收集模块根据终端用户访问网站类型,确定数据收集类型并将收 集的所述数据收集类型对应的访问数据发送至网站日志数据处理模块; 所述网站日志数据处理模块对所述数据收集类型对应的访问数据进行处理后,输 出至目标存储区域。 本专利技术还提供一种网站日志数据处理装置,包括网站日志数据收集模块、网站日 志数据处理模块;其中,所述网站日志数据收集模块与所述网站日志数据处理模块相连; 所述网站日志数据收集模块,用于根据终端用户访问网站类型,确定数据收集类 型并将收集的所述数据收集类型对应的访问数据发送至网站日志数据处理模块; 所述网站日志数据处理模块,用于对所述数据收集类型对应的访问数据进行处理 后,输出至目标存储区域。 通过以下方案:网站日志数据收集模块根据终端用户访问网站类型,确定数据收 集类型并将收集的所述数据收集类型对应的访问数据发送至网站日志数据处理模块;所述 网站日志数据处理模块对所述数据收集类型对应的访问数据进行处理后,输出至目标存储 区域;实现了对不同类型网站对应的不同访问数据进行有效收集,为网站建设提供了重要 数据支撑。 通过以下方案:所述数据收集类型包括访问时间、IP地址、域名、URL、页面标题、 参照文档、浏览客户端、客户端语言、访客标识、网站标识;多样化的数据类型,保证数据采 集的全面性及准确性。【附图说明】 附图用来提供对本专利技术技术方案的进一步理解,并且构成说明书的一部分,与本 申请的实施例一起用于解释本专利技术的技术方案,并不构成对本专利技术技术方案的限制。 图1为实现本专利技术实施例1的网站日志数据处理方法流程图; 图2为根据本专利技术实施例2的网站日志数据处理装置结构图; 图3为根据本专利技术实施例3的网站日志数据处理装置又一结构图; 图4为根据本专利技术实施例4的网站日志数据处理装置又一结构图。【具体实施方式】 下文中将参考附图并结合实施例来详细说明本专利技术。需要说明的是,在不冲突的 情况下,本申请中的实施例及实施例中的特征可以相互组合。 图1为实现本专利技术实施例1的网站日志数据处理方法流程图,包括以下步骤: 步骤101 :网站日志数据收集模块根据终端用户访问网站类型,确定数据收集类 型并将收集的所述数据收集类型对应的访问数据发送至网站日志数据处理模块; 进一步地,网站日志数据收集模块收集所述数据收集类型对应的访问数据的过程 为: 网站日志数据收集模块通过执行设置的埋点程序,收集所述数据收集类型对应的 访问数据。 进一步地,所述埋点程序的执行过程为:通过在页面中加入一段javascript代 码,并动态创建一个script标签,并将src指向一个单独的javascript文件并由所述 javascript文件收集所述数据收集类型对应的访问数据。 进一步地,所述javascript文件将收集的所述数据收集类型对应的访问数据,通 过http参数的方式传递给网站日志数据处理模块。 进一步地,所述数据收集类型包括访问时间、IP地址、域名、URL、页面标题、参照文 档、浏览客户端、客户端语言、访客标识、网站标识。 进一步地,网站日志数据收集模块预先存储网站类型与数据收集类型对照表。 进一步地,网站类型与数据收集类型对照表,例如表1所示: 网站类型与数据收集类型对照表 表1 步骤102 :所述网站日志数据处理模块对所述数据收集类型对应的访问数据进行 处理后,输出至目标存储区域。 进一步地,所述网站日志数据处理模块对所述数据收集类型对应的访问数据进行 处理后,输出至目标存储区域的过程为: 所述网站日志数据处理模块解析所述javascript文件发送的http参数信息后, 设置相应的网站日志数据格式的变量并将所述数据收集类型对应的访问数据记录到日志 文件中,输出至目标存储区域。 图2为根据本专利技术实施例2的网站日志数据处理装置结构图,包括网站日志数据 收集模块201、网站日志数据处理模块202 ;其中,所述网站日志数据收集模块201与所述网 站日志数据处理模块202相连;当前第1页1 2 本文档来自技高网...

【技术保护点】
一种网站日志数据处理方法,其特征在于,包括以下步骤:网站日志数据收集模块根据终端用户访问网站类型,确定数据收集类型并将收集的所述数据收集类型对应的访问数据发送至网站日志数据处理模块;所述网站日志数据处理模块对所述数据收集类型对应的访问数据进行处理后,输出至目标存储区域。

【技术特征摘要】

【专利技术属性】
技术研发人员:郭美思刘璧怡吴楠
申请(专利权)人:浪潮北京电子信息产业有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1