当前位置: 首页 > 专利查询>袁行远专利>正文

网页搜索结果排序方法及装置制造方法及图纸

技术编号:7898211 阅读:256 留言:0更新日期:2012-10-23 04:22
本发明专利技术提供一种网页搜索结果排序方法及装置。其中方法包括:搜索引擎根据用户输入的查询词搜索出多个相关的网页;获取所述网页的发布者的全网统一的用户标识P及所述网页的网页信息I;计算所述P及所述I的信息量和相关度;根据所述信息量和相关度计算得到所述I的信息质量得分;按照所述信息质量得分从大到小的顺序排列相应的网页。本发明专利技术在进行网页排序时不仅考虑了网页自身的因素,而且还考虑了人作为信息发布者的因素,使得真正具有高可信度的网页能够排在前列,因此提高了网页排序的可信性。

【技术实现步骤摘要】

本专利技术涉及一种网页搜索结果排序方法及装置,属于互联网搜索

技术介绍
随着互联网技术的发展,网络信息量呈现爆炸式增长,因此出现了搜索引擎服务,如百度、谷歌等。这种服务由索引擎服务器根据用户提供的查询词进行网页搜索,并将搜索出的相关网页的链接作为搜索结果呈现给用户。由于搜索出的相关网页数量通常不只一个,因此需要对这些网页搜索结果进行排序,现有技术中对网页搜索结果进行排序时通常采用如下的方法方法1,页面排序法(pageRank) 该方法根据网页之间相互的超链接关系计算页面等级,以作为网页排名的依据,具体地,该方法把从A页面到B页面的链接解释为A页面给B页面投票,从而根据投票来源和投票目标的等级来决定新的等级。方法2,学习排序法(learning to rank)该方法是一类机器学习排序方法的总称,主要是将待排序的网页与查询词进行配对,进行特征提取,这些特征包括文本相似度、用户点击率等信息;针对提取出的特征,以相关性或点击率为目标进行机器学习;根据机器学习结果计算每个网页与查询词之间的静态分数,以此分数为排序的依据。现有技术的主要缺陷在于在对网页搜索结果进行排序均只考虑了网页本文档来自技高网...

【技术保护点】
一种网页搜索结果排序方法,其特征在于,包括:搜索引擎根据用户输入的查询词搜索出多个相关的网页;获取所述网页的发布者的全网统一的用户标识P及所述网页的网页信息I;计算所述P及所述I的信息量和相关度;根据所述信息量和相关度计算得到所述I的信息质量得分;按照所述信息质量得分从大到小的顺序排列相应的网页。

【技术特征摘要】

【专利技术属性】
技术研发人员:袁行远龚颖坤
申请(专利权)人:袁行远
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1