一种搜索方法及装置制造方法及图纸

技术编号:9034026 阅读:178 留言:0更新日期:2013-08-15 00:51
本发明专利技术实施例公开了一种搜索方法,包括:获取待搜索信息的所有关联文档;基于词匹配算法及语义匹配算法,计算每一个关联文档与所述待搜索信息的相关度;根据计算得到的相关度对所有关联文档进行排序处理,并显示排序结果。本发明专利技术实施例还公开了一种搜索装置。本发明专利技术综合考虑词与词的匹配,以及词与词之间的语义关系的匹配,获得准确的相关度计算结果,为用户提供理想的搜索结果,提高用户的满意度。

【技术实现步骤摘要】

本专利技术涉及计算机网络搜索
,尤其涉及一种搜索方法及装置
技术介绍
目前,传统的搜索方案主要为:根据用户输入待搜索信息在网络中查找所有的关联文档,依据一定的算法规则计算每个关联文档与待搜索信息的关联程度,基于关联程度的高低对所有关联文档进行排序处理,将排序结果作为搜索结果返回给用户。上述可知,关联程度的高低直接影响关联文档的排序结果,直接影响用户的搜索结果,而关联程度的高低一般采用相关度评分直观反映。传统的搜索方案中,通常采用词匹配算法进行相关度计算,例如采用BM25(BestMatch,最佳匹配)算法、proximity (Term proximity scoring,词近邻得分)算法等等进行相关度评分,相关度评分越高,表明关联程度越强。以基于BM25算法的搜索方案进行说明,如下:假设用户输入的待搜索信息为“中国的首都”,根据BM25算法的相关度评分原则,关联文档中必须出现“中国”、“首都”,才能够获得相应的相关度评分,否则该关联文档的相关度评分则为O ;例如:其中一个关联文档为:“北京,它是一座有着3000多年的建城史,850多年的建者史的历史文化名城;是全国政治、文本文档来自技高网...

【技术保护点】
一种搜索方法,其特征在于,包括:获取待搜索信息的关联文档;基于词匹配算法及语义匹配算法,计算获取到的每一个关联文档与所述待搜索信息的相关度;根据计算得到的相关度对获取到的关联文档进行排序,并显示排序结果。

【技术特征摘要】

【专利技术属性】
技术研发人员:路彦雄杨月奎王亮焦峰
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1