基于索引库的数据检索方法及系统技术方案

技术编号:14504330 阅读:113 留言:0更新日期:2017-01-31 12:17
本发明专利技术实施例提供了一种基于索引库的数据检索方法及系统。该方法应用于数据检索系统,该数据检索系统预先构建作为检索对象的基础数据所对应的基础索引库;该方法包括:当获得作为检索对象的辅助数据时,构建该辅助数据所对应的辅助索引库;该方法还包括:当获得数据检索请求时,确定当前所存在的至少一个目标索引库,该至少一个目标索引库包括基础索引库一类索引库,或者,该基础索引库和该辅助索引库两类索引库;基于所确定出的当前所存在的至少一个目标索引库以及所对应的检索对象,确定该数据检索请求所对应的检索结果。通过本方案可以降低更新索引库的工作量,且避免数据检索请求的响应受到影响。

【技术实现步骤摘要】

本专利技术涉及数据检索
,特别是涉及基于索引库的数据检索方法及系统
技术介绍
为了提高检索效率,数据检索系统通常会为检索对象构建索引库,然后基于索引库进行数据检索,其中,索引库通常为:将从检索对象中所提取出的一些信息作为索引信息组织而成。举例而言:对于一篇文档,所对应的索引信息为从该文档中提取的文字内容或者文档的属性参数,文档的属性参数可以为:作者姓名,文档类别,等等。其中,数据检索系统在启动时,会构建当前所存在的作为检索对象的基础数据所对应的索引库,进而基于该索引库执行后续的数据检索;并且,由于数据资源会不断增多,需要增加辅助数据来完善所存在的检索对象,此时,相应的索引库也需要更新,例如:对于百度、谷歌等的数据检索系统,由于每天的网络资源不断增加,这无疑使得需要不断增加辅助数据来完善检索对象,那么,相应的索引库也就需要不断更新。现有技术中,数据检索系统在获得所增加的辅助数据后,每次都基于所增加的辅助数据和当前所存在的检索对象,对当前所存在的索引库进行重构,从而在重构完成后,后续基于所重构的索引库来进行数据检索。尽管现有的方式能够保证索引库与检索对象的有效对应,但是,每次获得辅助数据对旧的索引库执行重构,导致更新索引库的工作量较大,并且,在执行重构过程无疑影响对数据检索请求的响应。
技术实现思路
本专利技术实施例的目的在于提供一种基于索引库的数据检索方法及系统,以>降低更新索引库的工作量且避免数据检索请求的响应受到影响。具体技术方案如下:第一方面,本专利技术实施例提供了一种基于索引库的数据检索方法,应用于数据检索系统,所述数据检索系统预先构建作为检索对象的基础数据所对应的基础索引库;所述方法包括:当获得作为检索对象的辅助数据时,构建所述辅助数据所对应的辅助索引库;所述方法还包括:当获得数据检索请求时,确定当前所存在的至少一个目标索引库,其中,所述至少一个目标索引库包括基础索引库一类索引库,或者,所述基础索引库和所述辅助索引库两类索引库;基于所确定出的当前所存在的至少一个目标索引库以及所对应的检索对象,确定所述数据检索请求所对应的检索结果。可选的,所述辅助索引库与所述基础索引库的构建方式相同。可选的,所述基于所确定出的当前所存在的至少一个目标索引库以及所对应的检索对象,确定所述数据检索请求所对应的检索结果,包括:从至少一个目标索引库中,分别确定是否存在与所述数据检索请求所携带检索词相匹配的索引信息,如果存在,从该目标索引库所对应的检索对象中,获得该索引信息所对应的初级检索结果;基于所获得的初级检索结果,确定所述数据检索请求所对应的检索结果。可选的,所述基于所获得的初级检索结果,确定所述数据检索请求所对应的检索结果,包括:对所获得的初级检索结果求并集;将求并集所得结果作为所述数据检索请求所对应的检索结果。可选的,获得作为检索对象的辅助数据的方式包括:基于网络爬虫定时上传数据的方式,获得作为检索对象的辅助数据;或者,基于定时从网络爬虫处请求数据的方式,获得作为检索对象的辅助数据。可选的,获得作为检索对象的辅助数据的方式包括:基于人工导入数据方式,获得作为检索对象的辅助数据。可选的,所述辅助索引库与所述基础索引库的构建方式为:倒排表方式。第二方面,本专利技术实施例提供了一种基于索引库的数据检索系统,所述数据检索系统预先构建作为检索对象的基础数据所对应的基础索引库;所述系统包括:辅助索引库构建模块,用于当获得作为检索对象的辅助数据时,构建所述辅助数据所对应的辅助索引库;所述系统还包括:目标索引库确定模块,用于当获得数据检索请求时,确定当前所存在的至少一个目标索引库,其中,所述至少一个目标索引库包括基础索引库一类索引库,或者,所述基础索引库和所述辅助索引库两类索引库;检索结果确定模块,用于基于所确定出的当前所存在的至少一个目标索引库以及所对应的检索对象,确定所述数据检索请求所对应的检索结果。可选的,所述辅助索引库与所述基础索引库的构建方式相同。可选的,所述检索结果确定模块,包括:初级索引结果获得单元,用于从至少一个目标索引库中,分别确定是否存在与所述数据检索请求所携带检索词相匹配的索引信息,如果存在,从该目标索引库所对应的检索对象中,获得该索引信息所对应的初级检索结果;检索结果确定单元,用于基于所获得的初级检索结果,确定所述数据检索请求所对应的检索结果。可选的,所述检索结果确定单元,包括:并集求取子单元,用于对所获得的初级检索结果求并集;检索结果确定子单元,用于将求并集所得结果作为所述数据检索请求所对应的检索结果。可选的,所述辅助索引库构建模块获得作为检索对象的辅助数据的方式包括:基于网络爬虫定时上传数据的方式,获得作为检索对象的辅助数据;或者,基于定时从网络爬虫处请求数据的方式,获得作为检索对象的辅助数据。可选的,所述辅助索引库构建模块获得作为检索对象的辅助数据的方式包括:基于人工导入数据方式,获得作为检索对象的辅助数据。可选的,所述辅助索引库与所述基础索引库的构建方式为:倒排表方式。本专利技术实施例中,数据检索系统预先构建作为检索对象的基础数据所对应的基础索引库,并当获得作为检索对象的辅助数据时,构建该辅助数据所对应的辅助索引库;进而,当获得数据检索请求时,确定当前所存在的至少一个目标索引库;基于所确定出的当前所存在的至少一个目标索引库以及所对应的检索对象,确定该数据检索请求所对应的检索结果。可见,与现有技术相比,本方案并不依据多次获得的辅助数据对基础索引库重构,而是在保证基础索引库不变的情况,增设辅助数据所对应的辅助索引库,因此,可以降低更新索引库的工作量且避免数据检索请求的响应受到影响。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例所提供的一种基于索引库的数据检索方法的流程图;图2为本专利技术实施例所提供的一种基于索引库的数据检索系统的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一本文档来自技高网...

【技术保护点】
一种基于索引库的数据检索方法,其特征在于,应用于数据检索系统,所述数据检索系统预先构建作为检索对象的基础数据所对应的基础索引库;所述方法包括:当获得作为检索对象的辅助数据时,构建所述辅助数据所对应的辅助索引库;所述方法还包括:当获得数据检索请求时,确定当前所存在的至少一个目标索引库,其中,所述至少一个目标索引库包括基础索引库一类索引库,或者,所述基础索引库和所述辅助索引库两类索引库;基于所确定出的当前所存在的至少一个目标索引库以及所对应的检索对象,确定所述数据检索请求所对应的检索结果。

【技术特征摘要】
1.一种基于索引库的数据检索方法,其特征在于,应用于数据检索系统,
所述数据检索系统预先构建作为检索对象的基础数据所对应的基础索引库;所
述方法包括:当获得作为检索对象的辅助数据时,构建所述辅助数据所对应的
辅助索引库;
所述方法还包括:
当获得数据检索请求时,确定当前所存在的至少一个目标索引库,其中,
所述至少一个目标索引库包括基础索引库一类索引库,或者,所述基础索引库
和所述辅助索引库两类索引库;
基于所确定出的当前所存在的至少一个目标索引库以及所对应的检索对
象,确定所述数据检索请求所对应的检索结果。
2.根据权利要求1所述的方法,其特征在于,所述辅助索引库与所述基础
索引库的构建方式相同。
3.根据权利要求1所述的方法,其特征在于,所述基于所确定出的当前所
存在的至少一个目标索引库以及所对应的检索对象,确定所述数据检索请求所
对应的检索结果,包括:
从至少一个目标索引库中,分别确定是否存在与所述数据检索请求所携带
检索词相匹配的索引信息,如果存在,从该目标索引库所对应的检索对象中,
获得该索引信息所对应的初级检索结果;
基于所获得的初级检索结果,确定所述数据检索请求所对应的检索结果。
4.根据权利要求3所述的方法,其特征在于,所述基于所获得的初级检索
结果,确定所述数据检索请求所对应的检索结果,包括:
对所获得的初级检索结果求并集;
将求并集所得结果作为所述数据检索请求所对应的检索结果。
5.根据权利要求1所述的方法,其特征在于,获得作为检索对象的辅助数
据的方式包括:
基于网络爬虫定时上传数据的方式,获得作为检索对象的辅助...

【专利技术属性】
技术研发人员:虞航仲
申请(专利权)人:北京金山安全软件有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1