基于Borda算法的搜索结果排序方法技术

技术编号:13429949 阅读:63 留言:0更新日期:2016-07-30 00:34
基于Borda算法的搜索结果排序方法,属于搜索引擎结果排序领域。现有的Borda排序算法对于结果相关分值的计算时,所用的位置关系并不能完全代表相关度的变化,导致搜索结果排序不准确。一种基于Borda算法的搜索结果排序方法,先是对返回结果的位置得分统一规范化处理,并且结合进了检索词串与搜索结果的相似度,对相似度的计算方法也进行了改进。本发明专利技术利用标题和摘要进行相似度的计算时,结合了查询词与结果的匹配权重,使得相似度的计算更加准确;且提高搜索效率。

【技术实现步骤摘要】

本专利技术涉及一种基于Borda算法的搜索结果排序方法。
技术介绍
元搜索引擎是一个致力于解决独立搜索引擎的查准率和查全率不高的问题的搜索引擎,不用像搜索引擎那样需要建立索引数据库,当然亦不用检索机制等。它可以按照用户的兴趣或者搜索引擎的优秀程度来集成最符合用户需求的搜索引擎来实现其检索行为,而且它的搜索界面和传统的搜索引擎是一样的,对于返回的检索结果,元搜索引擎会按照其结果整合机制,去重之后,完成融合,再按照一定的算法来再排序,最后返回给用户的一个过程,因此,元搜索引擎中,结果的排序至关重要,目前对于结果排序算法的研究有很多,本文主要针对经典的Borda排序算法进行研究与改进,传统的加权位置排序算法中Borda排序最初是选举中,投票者对候选人进行投票的一种决策方法,因其效果良好,得到了广泛的应用。传统的Borda算法是基于加权位置排序算法的一种改进。对这种算法的进行如下描述:定义元搜索引擎中成员搜索引擎的集合是S={s1,s2,…,sn

【技术保护点】
一种基于Borda算法的搜索结果排序方法,其特征在于:所述方法通过以下步骤实现:步骤一、定义元搜索引擎中n个成员的搜索引擎的集合S={s1,s2,…,sn};查询词q;所有搜索结果rk的集合R={r1,r2,…,rm},下角标k表示位置,k=1,2,…,m,每一个搜索结果rk包括网址、标题、摘要和相关分值,采用数组形式分别表示为si_Url[k]、si_Title[k]、si_Abs[k]和si_Score[k],i=1,2,…,n;步骤二、在按照与查询词q的相关度排列得到的搜索结果列表中,进行搜索结果rk在搜索引擎中的位置k的得分计算,使位置得分统一规范化处理;步骤三、将查询词q与搜索结果rk的标题和摘要的相似度加权求和,进行搜索结果rk与用户输入的查询词q的全局相似度计算;步骤四、基于Borda排序的思想,搜索引擎对搜索结果rk投票,并综合步骤二得到的搜索结果rk的位置k的得分,最终累加得到每个搜索结果rk的最终相关得分;其中,每个搜索结果rk的最终相关得分表示为位置相关度和查询词q与搜索结果rk的相似度加权的和;步骤五、通过步骤四获得的每个搜索结果rk的最终相关得分表示搜索结果rk的相关分值,利用每个搜索结果rk的最终相关得分的相关分值对搜索结果rk降序排列,最终展现给用户。...

【技术特征摘要】
1.一种基于Borda算法的搜索结果排序方法,其特征在于:所述方法通过以下步骤实现...

【专利技术属性】
技术研发人员:王红滨董宇欣王让李自金刘红丽张玉鹏杨楠刘广强冯梦园刘天宇
申请(专利权)人:哈尔滨工程大学
类型:发明
国别省市:黑龙江;23

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1