一种检索方法和系统技术方案

技术编号:5090156 阅读:258 留言:0更新日期:2012-04-11 18:40
本申请提供了一种检索方法和系统,所述方法包括:根据客户端提交的查询数据,获得与所述查询数据相关的第一检索结果集合;根据所述集合中各个第一检索结果的第一相关性分值和预置的多样性字段,计算获取各个第一检索结果的第二相关性分值;多样性字段用于表示所述第一检索结果的属性类别;根据第一相关性分值和第二相关性分值生成各个第一检索结果的相关性参数值;按照第二检索结果的预置个数和所述相关性参数值,从所述第一检索结果集合中抽取需要向客户端展示的第二检索结果。采用本申请的方法或系统,在搜索结果多样性过程中系统资源的消耗更小、运算更快以及扩展更灵活。

【技术实现步骤摘要】

本申请涉及网络数据处理领域,特别涉及一种检索方法和系统
技术介绍
在搜索引擎的搜索过程中,对搜索结果按照某些属性(例如地域、来源或主题 等)进行二次排序,使得前η (η >= 1)条搜索结果在属性上呈现分布的多样性,这样的现 象称为搜索结果多样化。在电子商务搜索中,搜索结果通常按照结果的相关性或者时间来 排序,这样的话将会导致供应商不断的发布同一种产品的信息,以使得自己的产品能够占 据搜索结果的前几页,从而恶意地挤掉其他供应商的产品展示机会,而且给普通用户找到 其他产品造成一定的困难。为了避免这种现象,现有技术中,有一种通过抽取并按照相关性分级的方式进行 检索的方法,其具体实现过程为预先对搜索结果按照相关性进行分档,相关性分数值相近 的搜索结果被划分到同一个档,然后再针对每个档中的搜索结果进行抽取,该抽取的方式 为选取一个字段作为多样化的依据,例如uid(供应商的唯一标识),则搜索结果中就包 括了多样化的供应商产品。在实际中,需要把搜索结果按照Uid的值划分成很多子集合,属 于同一个Uid的搜索结果被划分到一个子集合中,并在该子集合内按照相关性分数值从大 到小排序,然后抽本文档来自技高网...

【技术保护点】
一种检索方法,其特征在于,该方法包括:根据客户端提交的查询数据,获得与所述查询数据相关的第一检索结果集合;根据所述集合中各个第一检索结果的第一相关性分值和预置的多样性字段,计算获取所述各个第一检索结果的第二相关性分值;所述多样性字段用于表示所述第一检索结果的属性类别;根据所述第一相关性分值和第二相关性分值生成所述各个第一检索结果的相关性参数值;按照第二检索结果的预置个数和所述相关性参数值,从所述第一检索结果集合中抽取需要向客户端展示的第二检索结果。

【技术特征摘要】

【专利技术属性】
技术研发人员:张理李金辉郭瑞杰
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:KY[开曼群岛]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1