【技术实现步骤摘要】
本专利技术涉及信息检索技术,尤其涉及一种信息检索方法及服务器。
技术介绍
现有检索技术大多是基于查询串的重要性而进行检索的;例如,根据用户输入的查询串的重要性,对查询串中不重要的部分查询词进行舍弃,并利用同义词匹配原则,从检索数据库中选取出与查询串中剩余的查询词同义词匹配的查询结果;这里,所述查询结果可以是根据剩余的查询词在检索数据库所对应的权重而进行排序后的信息。上述过程中,严重依赖所有查询词或者至少部分查询词是否出现在检索数据库的文章中,以及出现的次数,位置等,且上述出现的次数、位置等特征影响查询结果中文章的权重,以及排序;这里,当舍弃的查询词虽然未出现查询结果中,但是与查询结果中目标文章的语义相关性较高,此时,利用上述方法得到的查询结果显然会将语义相关性较高的目标文章的排序靠后,因此,延长了用户寻找目标文章的时间,降低了用户体验。
技术实现思路
为解决现有存在的技术问题,本专利技术实施例提供了一种信息检索方法及服务器。本专利技术实施例的技术方案是这样实现的:本专利技术实施例提供了一种信息检索方法,包括:获取待检索数据,其中,所述待检索数据包含有至少两个待检索子数据;从所述至少两个待检索子数据中确定出至少一个第一待检索子数据以及至少一个第二待检索子数据;基于至少一个第一待检索子数据,从检索数据库中进行初级检索,得到初级检索结果;其中,所述初级检索结果为至少包含有所述至少一个 ...
【技术保护点】
一种信息检索方法,其特征在于,所述方法包括:获取待检索数据,其中,所述待检索数据包含有至少两个待检索子数据;从所述至少两个待检索子数据中确定出至少一个第一待检索子数据以及至少一个第二待检索子数据;基于至少一个第一待检索子数据,从检索数据库中进行初级检索,得到初级检索结果;其中,所述初级检索结果为至少包含有所述至少一个第一待检索子数据的信息;获取到所述检索数据库中的子数据与所述至少一个第二待检索子数据的特征相似度,基于特征相似度从所述子数据中选取至少一个目标关键字;基于至少一个目标关键字,在所述初级检索结果中选取并输出目标检索结果。
【技术特征摘要】
1.一种信息检索方法,其特征在于,所述方法包括:
获取待检索数据,其中,所述待检索数据包含有至少两个待检索子数据;
从所述至少两个待检索子数据中确定出至少一个第一待检索子数据以及至
少一个第二待检索子数据;
基于至少一个第一待检索子数据,从检索数据库中进行初级检索,得到初
级检索结果;其中,所述初级检索结果为至少包含有所述至少一个第一待检索
子数据的信息;
获取到所述检索数据库中的子数据与所述至少一个第二待检索子数据的特
征相似度,基于特征相似度从所述子数据中选取至少一个目标关键字;
基于至少一个目标关键字,在所述初级检索结果中选取并输出目标检索结
果。
2.根据权利要求1所述的方法,其特征在于,所述从所述至少两个待检索
子数据中确定出至少一个第一待检索子数据以及至少一个第二待检索子数据,
包括:
获取所述至少两个待检索子数据所对应的权重值;
基于权重值,从所述至少两个待检索子数据中确定出至少一个第一待检索
子数据以及至少一个第二待检索子数据。
3.根据权利要求1所述的方法,其特征在于,所述获取到所述检索数据库
中的子数据与所述至少一个第二待检索子数据的特征相似度,包括:
计算所述至少一个第二待检索子数据对应的目标向量与所述检索数据库中
的至少一个子数据对应的至少一个向量的向量相似度;
基于向量相似度确定至少一个目标关键字。
4.根据权利要求3所述的方法,其特征在于,所述方法包括:
对所述检索数据库中的文本数据做分词处理,得到至少一个子数据;
对所述至少一个子数据进行处理,得到与所述至少一个子数据对应的至少
\t一个向量。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述基于特征相
似度从所述子数据中选取至少一个目标关键字,包括:
基于特征相似度,在所述检索数据库的至少一个子数据中选取出特征相似
度高于预设门限值的至少一个目标子数据,将所述至少一个目标子数据作为至
少一个目标关键字。
6.根据权利要求1至4任一项所述的方法,其特征在于,所述基于特征相
似度从所述子数据中选取至少一个目标关键字,包括:
基于特征相似度,对所述检索数据库中的至少一个子数据进行降序排列,
选取排序结果位于预设位数之前的至少一个目标子数据,将所述至少一个目标
子数据作为至少一个目标关键字。
7.根据权利要求1至4任一项所述的方法,其特征在于,所述输出目标检
索结果,包括:
根据计算出的所述至少一个目...
【专利技术属性】
技术研发人员:康战辉,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。