【技术实现步骤摘要】
本专利技术涉及数据处理领域,特别是涉及一种分布式计算网络的日志文件分 冲斤方法和系统。
技术介绍
随着互联网上信息服务的发展,许多政府部门、公司、大专院校、科研院所等都已经拥有或正在建设自己的网站。每个网站的后面都运行着一个Web 服务器,Web服务器是一个用于管理Web页面的软件,并使这些页面通过本地 网络或Internet供客户浏览器使用。现在较常用的Web服务器包括Apache、 IIS和Iplanet的Enterprise服务器。对网站的管理,要求不仅仅关注服务 器每天的吞吐量,还要了解网站各页面的访问情况,根据各页面的点击频率来 改善网页的内容和质量、提高内容的可读性,跟踪包含有商业交易的步骤以及 管理Web网站"幕后"的婆:据等。尤其对于以电子商务或搜索引擎为业务的网络公司而言,更是如此;需要对web服务器的运行和访问情况进行详细和周全的分析,了解网站运行情况, 发现网站存在的不足,促进网站的更好发展,而这些要求都可以通过对web 服务器的日志文件的统计和分析来做到。常见的日志分析工具有WebTrends、 Wusage、 wwwstat、 http ...
【技术保护点】
一种基于分布式计算网络的日志文件分析方法,其特征在于,包括以下步骤:将用户标识与相应的日志信息存储在日志文件中;将所述日志文件划分为多个目标文件,所述目标文件中含有相同用户标识的日志信息;使用两个以上的节点分别对所述目标文件进行分析并得到分析结果;合并各节点的分析结果。
【技术特征摘要】
【专利技术属性】
技术研发人员:吴伟勋,李江华,张金银,李昂,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:KY[]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。