【技术实现步骤摘要】
本专利技术涉及信息搜索技术,尤其涉及一种检索结果相似条目的合并方法及其系统。
技术介绍
随着计算机及信息技术的快速发展,由计算机自动或辅助用户生成的信息越来越多,如何在海量信息中检索特定信息由此变得十分重要。为了解决此类问题,各种计算机信息检索技术应运而生,包括计算机文件检索系统、网络搜索引擎、在线数据库联机检索系统等。计算机用户利用这些系统通过键入关键词而查找所需信息,此类系统在很大程度上解决了用户检索信息的难题,但是它们还缺乏精确检索的能力以及良好的用户体验。例如,用户在使用大多数网络搜索引擎使用关键词检索信息时,经常会得到来自于不同来源的内容雷同的条目。当此类条目数量显著时,用户会收到大量重复信息对其的干扰,不利于用户迅 速准确的获取所需信息。同时,经过多年发展,计算机文件相似度检测技术也逐渐成熟。例如,使用散列算法可以检测文件内容是否相同,通过计算两个文件的Jaccard指数或者其它类似的SimHashing算法可得到两个文件的相似度。此类技术和技术已被广泛的用于检索文本文件的相似度。随着用户搜索需求的增长,通常单一的搜索引擎难以满足用户搜索的需要,因此 ...
【技术保护点】
一种检索结果相似条目的合并方法,其特征在于,包括如下步骤:步骤一:获取包含至少一项条目的检索结果;步骤二:对所述检索结果中的条目进行相似度对比,获得所述条目之间的相似度对比值;步骤三:将所述相似度对比值与所述相似度阈值比较,根据比较结果,合并相似条目;步骤四:显示相似条目合并后的检索结果。
【技术特征摘要】
1.一种检索结果相似条目的合并方法,其特征在于,包括如下步骤步骤一获取包含至少一项条目的检索结果;步骤二 对所述检索结果中的条目进行相似度对比,获得所述条目之间的相似度对比值;步骤三将所述相似度对比值与所述相似度阈值比较,根据比较结果,合并相似条目; 步骤四显示相似条目合并后的检索结果。2.如权利要求I所述检索结果相似条目的合并方法,其特征在于,所述步骤一中的检索结果的生成步骤包括步骤Al :获取关键词,对所述关键词进行预处理;步骤A2 :判断所述预处理后的关键词是否符合要求;若符合要求的,则根据所述关键词进行检索生成检索结果;若不符合要求的,则重新执行所述步骤Al、A2,直至生成检索结果O3.如权利要求I所述检索结果相似条目的合并方法,其特征在于,所述步骤一中进一步包括根据权值将所述条目由高到低排序。4.如权利要求3所述检索结果相似条目的合并方法,其特征在于,进一步包括权值相同的所述条目根据所述条目被引用次数由高到低排序。5.如权利要求I所述检索结果相似条目的合并方法,其特征在于,所述步骤三中,所述相似度阈值采用默认值或用户设定值。6.如权利要求I所述检索结果相似条目的合并方法,其特征在于,所述步骤三中,所述合并相似条目包括步骤BI :判断已处理条目集合是否为空;若所述已处理条目集合为空,则初始化所述已处理条目集合,将所述检索结果中的未处理条目集合中的任意一个条目作为起始条目, 并将该起始条目存入所述已处理条目集合中,执行步骤B2 ;若所述已处理条目集合不为空,则执行步骤B2 ;步...
【专利技术属性】
技术研发人员:李道远,程鑫,高俊,顾鑫,
申请(专利权)人:江苏外博资讯有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。