一种基于蚁群算法的搜索引擎排序方法技术

技术编号:6955017 阅读:269 留言:0更新日期:2012-04-11 18:40
在PageRank算法的基础上应用蚁群算法的主要思想,对网页按关键字检索后被点击的次数进行统计,根据其在初始排序结果中的位置对网页进行分类,通过给定的函数变换对按照以上两个因素统计分析所得的结果进行运算,将其作为网页与关键字关联度的一个评判依据。从而对网页的权值(PR值)进行迭代修正,并返回一个新的排序结果。通过实验表明,此方法在使得返回结果中相关度较高的网页通过人们的自主选择获得了不同程度的加权,使得其在返回结果中的排名得到提升,更容易被检索到,提高了查准率。

【技术实现步骤摘要】

本专利技术属于网页排序技术类,是一种搜索引擎排序方法。本专利技术采用一定的技术手段,可以提高搜索引擎排序结果的满意度,改善搜索系统性能。
技术介绍
目前的搜索引擎返回结果过多,用户很难从中快速筛选出真正需要的信息。如果搜索引擎只返回相关度高的网页,既可以很大程度地节省用户时间,又可以减轻网络流量。 斯坦福大学的Sergey Brin等人提出的PageRank算法在Google搜索引擎得到了成功的应用,开启了链接分析技术的研究热潮。PageRank算法的初始描绘是这样的如果一个网页的链入网页的排序值总和高,则这个网页的排序值高。PageRank算法单纯从链接分析的角度入手进行网页排序,忽略了用户的查询意图,难以取得更好的排序效果。蚁群算法是Dorigo M等人提出的,蚂蚁个体之间是通过一种称之为信息素的物质进行信息传递的。在运动过程中,蚂蚁能够在它所经过的路径上留下这种信息素,而且能够感知信息度的浓度,并以此指导自己的运动方向,倾向于朝着信息浓度高的方向移动。
技术实现思路
本专利技术的目的是提供一种计算搜索引擎网页排序的新算法,提高用户搜索意图结果的查准率。为达到上述专利技术目的,通过如下措施来实现。,其特征是给定某一查询词的条件下,在搜索完成后,对其所显示网页进行点击,真正被用户需求的网页被大部分用户点击,定义每个显示结果页面中的网页予以不同的信息素值,越靠后的网页,若被点击到所获得的权值较高。统计用户点击网页的次数,乘以该网页的信息素值,所得值加上该网页原始的 Pagerank值,得到该网页的最终排序值,从而达到对网页排序算法的改进,得到用户查询到目标网页的最短路径,提升了用户真正感兴趣的网页名次,从而使用户可以更快地找到自己所需的结果。本专利技术的优点效果为通过能够链接到目标网页的全部路径上的网页进行加权, 也就是这些网页的信息熵赋予较高的值,使得最终目标网络的排序值较大,能够排到搜索结果的前面,形成用户查询到目标网页的最短路径,达到较佳的搜索效果。附图说明附图是本专利技术原理图。具体实施例方式下面对本专利技术作进一步描述 ,首先用原始的PageRank算法计算出网页的权值,然后用关键字查询并返回推荐结果,用Fi对首次返回的排序结果按次序命名; 然后通过用户的主观判断对相应网页进行点击,并将此关键字在搜索到的集合中建立点击次数属性用于改进结果。运行一段时间后,用改进后的排序算法来计算网页的权值并重新排序。其特征是在保证召回率和查准率的前提下为提高用户搜索意图,从网页相对于关键字的点击率出发,通过蚁群算法的信息熵概念将用户的群体选择加入到网页权值计算中去,提高相关网页的查准率。权利要求1.,其特征在于搜索结果的网页被点击的次数,真正被用户需求的网页会被大部分用户点击,其相应的信息度就会越来越高。2.如权利要求1所述的,其特征在于网页在搜索结果中的排名越靠后,其被点击到后包含的信息熵就越高。3.如权利要求1所述的,其特征是在通过用户的主观判断对相关网页进行点击,并将此关键字在搜索到的集合中建立点击次数属性用于改进最终排序结果。全文摘要在PageRank算法的基础上应用蚁群算法的主要思想,对网页按关键字检索后被点击的次数进行统计,根据其在初始排序结果中的位置对网页进行分类,通过给定的函数变换对按照以上两个因素统计分析所得的结果进行运算,将其作为网页与关键字关联度的一个评判依据。从而对网页的权值(PR值)进行迭代修正,并返回一个新的排序结果。通过实验表明,此方法在使得返回结果中相关度较高的网页通过人们的自主选择获得了不同程度的加权,使得其在返回结果中的排名得到提升,更容易被检索到,提高了查准率。文档编号G06F17/30GK102279895SQ20111027945公开日2011年12月14日 申请日期2011年9月20日 优先权日2011年9月20日专利技术者周延泉, 许力波 申请人:北京邮电大学本文档来自技高网...

【技术保护点】
1.一种基于蚁群算法的搜索引擎排序方法,其特征在于:搜索结果的网页被点击的次数,真正被用户需求的网页会被大部分用户点击,其相应的信息度就会越来越高。

【技术特征摘要】

【专利技术属性】
技术研发人员:许力波周延泉
申请(专利权)人:北京邮电大学
类型:发明
国别省市:11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1