一种基于用户停留时间分析的个性化网页搜索排序方法技术

技术编号：6802818 阅读：435 留言：0更新日期：2012-04-11 18:40

本发明专利技术公开了一种基于用户停留时间分析的个性化网页搜索排序方法，该方法首先通过一个自定义网页浏览器获取文档级的用户停留时间，据此推测出在概念词级的用户停留时间；然后跟据推测获得的概念词级的用户停留时间，进一步预测该用户对任意网页搜索结果中的每个网页的个性化阅读兴趣；最终依据该用户的个性化阅读兴趣生成面向这一用户的个性化网页搜索结果。本发明专利技术利用人工智能相关技术，应用网页搜索和文本处理等方法来估计用户对于不同概念的阅读兴趣，从而将个人阅读习惯和需求考虑在网页搜索排序的过程中，使得网页搜索结果排序更加贴近用户个性化预期的结果，为用户提供更好的网络搜索和浏览支持。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及计算机搜索、数据挖掘以及人工智能领域，尤其涉及一种基于用户停留时间的个性化网页搜索排序方法。
技术介绍
近年来，出现了一系列的研究活动，以研究个性化或面向用户的搜索引擎和算法，如2007年发表在第十六届国际万维网会议(WWW，07:Proceedings of the 16th international conference on World Wide Web)上的一篇文章“个性化搜索策略的大规 ^tMWift"τ '^ ” ( "A large-scale evaluation and analysis of personalized search strategies”)。在2008年第二十三届美国人工智能学会会议上的一篇文章“基于用户关webpage ranking algorithm based on user attention time")里，作者也提出建立一个面向用户的网页搜索引擎的个性化解决方案。现有的个性化引擎依靠的是用户的反馈，它可以分为显式反馈和隐式反馈。我们从这两种反馈中都可以得到用户的喜好特征(Salton&Buckley 1990 ；White, Jose, &Ruthven 2001 ；White, Ruthven, &Jose 2002)。但是用户一般都不愿意去提供显式的反馈，所以现在的研究越来越多的研究都转向隐式反馈(Granka，Joachims, &Gay 2004 ； Guan&Cutrell 2007 ；Fu 2007)。研究表明，隐式反馈可以很好的反映用...

【技术保护点】
１．一种基于用户停留时间分析的个性化网页搜索排序方法，其特征在于：包括以下步骤：１）获取用户在其阅读过的每个网页上的用户停留时间；２）将用户阅读过的每个网页都表示成一个由若干个概念词组成的集合；３）推测用户在每个概念词上的用户停留时间；４）估计用户对搜索结果中每个网页的阅读兴趣，并生成个性化的网页搜索结果。

【技术特征摘要】

【专利技术属性】
技术研发人员：徐颂华，江浩，刘智满，
申请(专利权)人：浙江大学，
类型：发明
国别省市：86

全部详细技术资料下载我是这个专利的主人