基于用户兴趣向量的个性化网页搜索排序方法技术

技术编号:8594032 阅读:314 留言:0更新日期:2013-04-18 07:13
本发明专利技术公开了一种基于用户兴趣向量的个性化网页搜索排序方法。包括以下步骤:1)对指定用户进行问卷调查,提取用户兴趣主题;2)捕捉用户的点击历史信息如何同其兴趣相关,并结合问卷调查结果,构造一个页面-主题关系表;3)根据用户的页面-主题关系表,进一步推测出用户兴趣向量;4)依据用户兴趣向量和用户查询,生成个性化网页搜索排序结果。本发明专利技术有效的结合了对用户的问卷调查和用户点击历史信息,将用户的兴趣向量结合在网页搜索与排序的过程中,使得网页搜索结果排序更加贴近用户的个性化需求,为用户提供其真正需要的网络搜索服务。

【技术实现步骤摘要】

本专利技术涉及信息检索、数据挖掘以及人工智能领域,是一种。
技术介绍
随着网络技术的发展,互联网上的信息成指数级增长。海量的信息使用户发现和获取信息变得非常困难。目前,很多网页搜索引擎主要是通过用户点击数据、历史网站、网络地址等比较容易获得但不易于发掘用户个性化特征的信息来对不同用户实现个性化的搜索结果。为了解决不同用户间的查询差异,本文提出一种新的网页推荐方法,即对特定领域用户进行问卷调查,再将提取的问卷调查信息和用户历史点击信息相结合,建立用户个性化的兴趣向量,基于用户个性化的兴趣向量生成更贴近用户兴趣的网页搜索排序结果。
技术实现思路
本专利技术的目的是克服现有技术的不足,提供。1. —种,其特征在于包括以下步骤I)对指定用户进行问卷调查,提取用户兴趣主题;2)捕捉用户的点击历史信息如何同其兴趣相关,并结合问卷调查结果,构造一个页面-主题关系表;`3)根据用户的页面一主题关系表,进一步推测出用户兴趣向量;4)依据用户兴趣向量和用户查询,生成个性化网页搜索排序结果。2.根据权利要求1所述的一种,其特征在于所述的对指定用户进行问卷调查,提取用户兴趣主题步骤为a)面向特定用户,对其进行问卷调查,以分析其兴趣;b)分析问卷调查结果,提取用户兴趣主题X。3.根据权利要求1所述的一种,其特征在于所述的捕捉用户的点击历史信息如何同其兴趣相关,并结合问卷调查结果,构造一个页面-主题关系表步骤为c)根据用户历史点击信息,提取用户兴趣主题y,并结合问卷调查结果生成比较全面的用户兴趣主题t,t = x+y ;d)通过查询预处理,计算链接到页面P」(j = I, ···, η)的页面集合Lp, Lp中页面Po的外出链接集合Iptl用户跟随Iptl的概率山计算与t相关的页面集合nt ;e)计算页面-主题关联矩阵Rpt (Rpt为一 mXn矩阵),其行元素即为与ti (i =1,…,m)相关的页面偏置随机跳转概率向量Eti(p) = [Et⑴,…,Et (η)]的各元素值,如下所示本文档来自技高网...

【技术保护点】
一种基于用户兴趣向量的个性化网页搜索排序方法,其特征在于包括以下步骤:1)对指定用户进行问卷调查,提取用户兴趣主题;2)捕捉用户的点击历史信息如何同其兴趣相关,并结合问卷调查结果,构造一个页面?主题关系表;3)根据用户的页面?主题关系表,进一步推测出用户兴趣向量;4)依据用户兴趣向量和用户查询,生成个性化网页搜索排序结果。

【技术特征摘要】
1.一种基于用户兴趣向量的个性化网页搜索排序方法,其特征在于包括以下步骤 1)对指定用户进行问卷调查,提取用户兴趣主题; 2)捕捉用户的点击历史信息如何同其兴趣相关,并结合问卷调查结果,构造一个页面_主题关系表; 3)根据用户的页面-主题关系表,进一步推测出用户兴趣向量; 4)依据用户兴趣向量和用户查询,生成个性化网页搜索排序结果。2.根据权利要求1所述的一种基于用户兴趣向量的个性化网页搜索排序方法,其特征在于所述的对指定用户进行问卷调查,提取用户兴趣主题步骤为 a)面向特定用户,对其进行问卷调查,以分析其兴趣; b)分析问卷调查结果,提取用户兴趣主题X。3.根据权利要求1所述的一种基于用户兴趣向量的个性化网页搜索排序方法,其特征在于所述的捕捉用户的点击历史信息如何同其兴趣相关,并结合问卷调查结果,构造一个页面-主题关系表步骤为 c)根据用户历史点击信息,提取用户兴趣主题y,并结合问卷调查结果生成比较全面的用户兴趣主题t, t = x+y ; d)通过查询预处理,计算链接到页面Pj(j= 1, ···, n)的页面集合Lp, Lp中页面P0的外出链接集合lp0用户跟随...

【专利技术属性】
技术研发人员:张健徐晓莉胡亮齐林张小栓冯飞邢晓辉魏宗洋王楠甘露刘菁
申请(专利权)人:北京信息科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1