当前位置: 首页 > 专利查询>南京大学专利>正文

一种基于k阶混合马尔可夫模型的Web页面访问预测方法技术

技术编号:6890158 阅读:220 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种基于k阶混合马尔可夫模型的Web页面访问预测方法,首先收集和整理Web服务器访问日志数据,识别客户端和用户,排除无意义的访问数据;再识别用户会话,组建Web日志数据库;并根据预测目标从数据库中选取日志数据,以会话为单位组织(k+1)元组,用于训练k阶混合马尔可夫模型;采用最大期望算法学习和校准k阶混合马尔可夫模型的参数集;根据目标用户页面访问操作识别会话,应用上述模型预测用户下一步访问的Web页面。本发明专利技术可向用户推荐需要访问的页面,减少页面访问的延迟,优化用户体验;从Web服务器角度可以改善Web页面的组织结构,指导搜索引擎的结果排序,改进页面缓存机制,从而提高服务质量。

【技术实现步骤摘要】

本专利技术涉及Web页面访问的个性化预测技术,特别针对互联网时代Web服务器信息越来越庞大和复杂,用户访问量越来越大的情况;需要根据用户的访问特点确定用户下一步可能访问的页面,帮助用户更快更好的找到所需要的信息;同时辅助Web服务器预先缓存用户需要的页面,改善页面链接结构,从而提高服务器访问效率。
技术介绍
伴随着互联网的快速发展,万维网(World Wide Web)已成为一个世界范围内的超媒体信息获取平台,人们越来越依赖于Web来获取各种信息,而浏览Web也已成为人们日常生活的一部分。一个完整的Web应用包括Web服务器、客户端浏览器、完成客户端和服务器间通信的HTTP协议、用于描述Web页面的超文本标记语言HTML和统一资源定位符URL。随着Web应用规模的不断扩大,Web服务器上所包含的页面越来越多,Web页面的组织结构也越来越复杂。用户很容易迷失在信息的海洋里。如何能让用户更快更好地找到自己所需要的信息;让Web服务器能够根据用户使用习惯提供个性化服务以提升服务质量,成为目前 Web应用领域需要解决的问题。
技术实现思路
本专利技术所要解决的技术问题是提供一种根据用户历史访问本文档来自技高网...

【技术保护点】
1.一种基于k阶混合马尔可夫模型的Web页面访问预测方法,其特征在于包含以下步骤:1)首先收集和整理Web服务器访问日志数据,针对日志中的每一项访问记录,识别客户端浏览器和用户;排除无意义的访问数据;根据每一项记录析取访问操作o=(u,x,t),其中u表示用户、x表示Web页面、t表示页面访问时间;2)识别用户会话S,用于组建Web日志数据库,储备用于Web页面访问预测的历史数据;3)根据预测目标从数据库中选取和组织日志数据,按会话整理和组织(k+1)元组集合;4)建立k阶混合马尔可夫模型,并采用最大期望算法训练该k阶混合马尔可夫模型,再基于数据集学习和校准k阶混合马尔可夫模型的参数集;5)基...

【技术特征摘要】

【专利技术属性】
技术研发人员:顾庆任颖新汤九斌陈道蓄
申请(专利权)人:南京大学
类型:发明
国别省市:84

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1