基于时间分片的Web用户浏览访问矩阵的构造方法技术

技术编号:8453107 阅读:232 留言:0更新日期:2013-03-21 17:38
一种基于时间分片的Web用户浏览访问矩阵的构造方法,根据用户在服务器的访问记录,采用时间分片的方法,将用户访问记录按访问的月份、星期和每天时段分成三类,分别转换成为三个访问矩阵数组,并为每类访问矩阵赋予相应的权重参数,最终得到一个平均访问矩阵。当用户访问网站的时候,将该平均访问矩阵作为输入,即可利用现有的偏爱路径算法得到用户偏爱浏览路径。本方法反映了不同时间用户的偏爱浏览行为也不同的特点,因而能获得更准确的用户偏爱浏览路径。同时,不同时间访问矩阵的权重参数可调节,增加了本方法的灵活性和适应性。

【技术实现步骤摘要】

本专利技术涉及如何根据用户浏览网页在服务器端留下的日志记录,得到用户偏爱浏览路径的方法,尤其涉及一种,属于Web数据挖掘

技术介绍
近几年来,Web技术的飞速发展,使得网络数据成为全球最大的信息资料源。最近的调查资料表明,全球有超过10亿张的网页数量,而且每天还在有无数的网页不停地增加和删除。如何在这些海量信息中提取出有用的信息,对各个企业和网站都有着重要的巨大的商业价值。数据挖掘就是研究这种信息挖掘技术的一个领域,它研究如何从大量信息的集合中挖掘出规则模式。作为一个崭新的研究领域,它正逐渐成为许多研究者的兴趣焦点。Web挖掘主要可以分为三类研究方向l)Web内容挖掘;2)Web结构挖掘;3)Web使用挖掘。Web使用挖掘也叫做Web日志挖掘。Web日志记录和汇聚了用户什么时候请求了什么资源,接收了什么数据的用户访问情况。因此,Web日志挖掘是帮助理解用户访问行为和网站结构的一个有用的方法。很多基于Web的应用都需要针对用户进行信息个性化处理。在电子商务中针对不同用户的浏览行为和喜好,为不同用户提供相应的动态采购建议。迄今为止,Web日志挖掘方法可以分为以Chen为代表的本文档来自技高网...

【技术保护点】
基于时间分片的Web用户浏览访问矩阵的构造方法,其特征是:在数据清洗阶段,根据互联网信息服务中的日志文件,建立并存储Web用户的访问记录表,然后,根据Web用户访问记录表中的访问时间,按月份、星期、每天时段三种不同粒度分别为每个Web用户建立三个时间分片的访问矩阵数组,当用户访问网站的时候,按照用户访问时间及权重计算得到一个平均访问矩阵,将该平均访问矩阵作为输入,利用现有的偏爱路径算法得到用户偏爱浏览路径;包括如下步骤:步骤1,数据清洗阶段,根据互联网信息服务中的日志文件,建立并存储Web用户的访问记录表,每条记录表示某个用户在一个访问时间点,从上一个引用页面跳转到当前访问页面的过程;记录表的...

【技术特征摘要】

【专利技术属性】
技术研发人员:吴家皋袁堂朋邹志强
申请(专利权)人:南京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1