一种全文检索方法及系统技术方案

技术编号:18398734 阅读:63 留言:0更新日期:2018-07-08 19:27
本发明专利技术提供了一种全文检索方法及系统,该方法包括:获取至少一个文件数据,确定每一个所述文件数据对应的描述信息;根据所述描述信息,构建每一个所述文件数据对应的文件索引;获取用户输入的检索信息;从所述检索信息中解析出至少一个检索关键词;从各个所述文件索引中确定与所述至少一个检索关键词对应的目标文件索引;确定所述目标文件索引对应的目标描述信息,并对所述目标描述信息进行展示。本方案能提高数据检索效率。

【技术实现步骤摘要】
一种全文检索方法及系统
本专利技术涉及计算机
,特别涉及一种全文检索方法及系统。
技术介绍
随着计算机技术的发展,数据呈现爆发式增长,如何从文件系统中快速检索到目标数据,对提高数据处理效率具有重要影响。Hadoop提供的分布式文件系统可存储大量的数据,各个数据分散存储在不同的存储装置中,例如分散在各个磁盘中。用户在检索目标数据时,需要对存储装置进行逐个查看,以确定存储装置中是否存在目标数据。由于文件系统中存储的数据量较大,各个数据的存储位置也不尽相同,因此采用逐个查找存储装置的方式来检索目标数据,效率较低。
技术实现思路
本专利技术实施例提供了一种全文检索方法及系统,能提高数据的检索效率。第一方面,本专利技术实施例提供了一种全文检索方法,包括:获取至少一个文件数据,确定每一个所述文件数据对应的描述信息;根据所述描述信息,构建每一个所述文件数据对应的文件索引;获取用户输入的检索信息;从所述检索信息中解析出至少一个检索关键词;从各个所述文件索引中确定与所述至少一个检索关键词对应的目标文件索引;确定所述目标文件索引对应的目标描述信息,并对所述目标描述信息进行展示。优选地,在所述获取用户输入的检索信息之后,进一步包括:获取用户输入的检索条件;所述从各个所述文件索引中确定与所述至少一个检索关键词对应的目标文件索引,包括:根据所述检索条件和各个所述检索关键词,确定所述目标文件索引。优选地,所述根据所述检索条件和各个所述检索关键词,确定所述目标文件索引,包括:根据所述检索条件携带的检索时间,以及各个所述文件索引对应的所述描述信息中的创建时间,从各个所述文件索引中确定出与所述检索时间对应的备选文件索引;从确定出的所述备选文件索引中确定与所述检索关键词对应的目标文件索引;优选地,所述根据所述检索条件和各个所述检索关键词,确定所述目标文件索引,包括:根据所述检索条件携带的检索文件类型,以及各个所述文件索引对应的所述描述信息中的创建文件类型,从各个所述文件索引中确定出与所述检索文件类型对应的备选文件索引;从确定出的所述备选文件索引中确定与所述检索关键词对应的目标文件索引;优选地,所述根据所述检索条件和各个所述检索关键词,确定所述目标文件索引,包括:根据所述检索条件中携带的拼接关系,对各个所述检索关键词进行组合;根据组合后的所述检索关键词,确定所述目标文件索引。优选地,进一步包括:在预设存储位置构建索引库;所述根据所述描述信息,构建每一个所述文件数据对应的文件索引,包括:利用预设的分词器对所述描述信息中的文件内容进行分词,获得至少一个内容关键词;利用预设的所述分词器对应的词典对所述至少一个内容关键词进行处理,并将处理后的所述内容关键词写入所述描述信息;利用预设的索引创建器将所述描述信息存入所述索引库,形成所述文件索引。优选地,进一步包括:接收用户输入的文件删除请求;根据所述文件删除请求,从所述至少一个文件数据中确定待删除文件数据;确定所述待删除文件对应的待删除描述信息以及待删除文件索引;利用所述索引创建器将所述待删除描述信息以及所述待删除文件索引从所述索引库中删除。第二方面,本专利技术实施例提供了一种全文检索系统,包括:索引构建单元、获取单元和检索单元;其中,所述索引构建单元,用于获取至少一个文件数据,确定每一个所述文件数据对应的描述信息,根据所述描述信息,构建每一个所述文件数据对应的文件索引;所述获取单元,用于获取用户输入的检索信息,并从所述检索信息中解析出至少一个检索关键词;所述检索单元,用于从各个所述文件索引中确定与所述至少一个检索关键词对应的目标文件索引;确定所述目标文件索引对应的目标描述信息,并对所述目标描述信息进行展示。优选地,所述获取单元,进一步用于获取用户输入的检索条件;所述检索单元,用于根据所述检索条件和各个所述检索关键词,确定所述目标文件索引。优选地,所述检索单元,用于根据所述检索条件携带的检索时间,以及各个所述文件索引对应的所述描述信息中的创建时间,从各个所述文件索引中确定出与所述检索时间对应的备选文件索引;从确定出的所述备选文件索引中确定与所述检索关键词对应的目标文件索引;优选地,所述检索单元,用于根据所述检索条件携带的检索文件类型,以及各个所述文件索引对应的所述描述信息中的创建文件类型,从各个所述文件索引中确定出与所述检索文件类型对应的备选文件索引;从确定出的所述备选文件索引中确定与所述检索关键词对应的目标文件索引;优选地,所述检索单元,用于根据所述检索条件中携带的拼接关系,对各个所述检索关键词进行组合;根据组合后的所述检索关键词,确定所述目标文件索引。优选地,进一步包括:设置单元;其中,所述设置单元,用于在预设存储位置构建索引库;所述索引构建单元,用于利用预设的分词器对所述描述信息中的文件内容进行分词,获得至少一个内容关键词;利用预设的所述分词器对应的词典对所述至少一个内容关键词进行处理,并将处理后的所述内容关键词写入所述描述信息;利用预设的索引创建器将所述描述信息存入所述索引库,形成所述文件索引。优选地,进一步包括:索引删除单元;其中,所述获取单元,进一步用于接收用户输入的文件删除请求;所述索引删除单元,用于根据所述文件删除请求,从所述至少一个文件数据中确定待删除文件数据;确定所述待删除文件对应的待删除描述信息以及待删除文件索引;利用所述索引创建器将所述待删除描述信息以及所述待删除文件索引从所述索引库中删除。本专利技术实施例提供了一种全文检索方法及系统,根据获取到的文件数据的描述信息生成各个文件数据对应的文件索引。当获取到用户输入的检索信息时,从检索信息中解析出检索关键词,并确定与检索关键词对应的目标文件索引,然后对目标文件索引对应的目标描述信息进行展示。由此实现对各个文件数据的自动检索,而无须采用逐个查找存储装置的方式来检索目标数据,从而提高了数据的检索效率。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术一个实施例提供的一种全文检索方法的流程图;图2是本专利技术一个实施例提供的一种全文检索系统的结构示意图;图3是本专利技术另一个实施例提供的一种全文检索系统的结构示意图;图4是本专利技术又一个实施例提供的一种全文检索系统的结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例,基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本专利技术保护的范围。如图1所示,本专利技术实施例提供了一种全文检索方法,该方法可以包括以下步骤:步骤101:获取至少一个文件数据,确定每一个所述文件数据对应的描述信息;步骤102:根据所述描述信息,构建每一个所述文件数据对应的文件索引;步骤103:获取用户输入的检索信息;步骤104:从所述检索信息中解析出至少一个检索关键词;步骤105:从各个所述文件索引中确定与所述至少一本文档来自技高网...

【技术保护点】
1.一种全文检索方法,其特征在于,包括:获取至少一个文件数据,确定每一个所述文件数据对应的描述信息;根据所述描述信息,构建每一个所述文件数据对应的文件索引;获取用户输入的检索信息;从所述检索信息中解析出至少一个检索关键词;从各个所述文件索引中确定与所述至少一个检索关键词对应的目标文件索引;确定所述目标文件索引对应的目标描述信息,并对所述目标描述信息进行展示。

【技术特征摘要】
1.一种全文检索方法,其特征在于,包括:获取至少一个文件数据,确定每一个所述文件数据对应的描述信息;根据所述描述信息,构建每一个所述文件数据对应的文件索引;获取用户输入的检索信息;从所述检索信息中解析出至少一个检索关键词;从各个所述文件索引中确定与所述至少一个检索关键词对应的目标文件索引;确定所述目标文件索引对应的目标描述信息,并对所述目标描述信息进行展示。2.根据权利要求1所述的方法,其特征在于,在所述获取用户输入的检索信息之后,进一步包括:获取用户输入的检索条件;所述从各个所述文件索引中确定与所述至少一个检索关键词对应的目标文件索引,包括:根据所述检索条件和各个所述检索关键词,确定所述目标文件索引。3.根据权利要求2所述的方法,其特征在于,所述根据所述检索条件和各个所述检索关键词,确定所述目标文件索引,包括:根据所述检索条件携带的检索时间,以及各个所述文件索引对应的所述描述信息中的创建时间,从各个所述文件索引中确定出与所述检索时间对应的备选文件索引;从确定出的所述备选文件索引中确定与所述检索关键词对应的目标文件索引;和/或,所述根据所述检索条件和各个所述检索关键词,确定所述目标文件索引,包括:根据所述检索条件携带的检索文件类型,以及各个所述文件索引对应的所述描述信息中的创建文件类型,从各个所述文件索引中确定出与所述检索文件类型对应的备选文件索引;从确定出的所述备选文件索引中确定与所述检索关键词对应的目标文件索引;和/或,所述根据所述检索条件和各个所述检索关键词,确定所述目标文件索引,包括:根据所述检索条件中携带的拼接关系,对各个所述检索关键词进行组合;根据组合后的所述检索关键词,确定所述目标文件索引。4.根据权利要求1所述的方法,其特征在于,进一步包括:在预设存储位置构建索引库;所述根据所述描述信息,构建每一个所述文件数据对应的文件索引,包括:利用预设的分词器对所述描述信息中的文件内容进行分词,获得至少一个内容关键词;利用预设的所述分词器对应的词典对所述至少一个内容关键词进行处理,并将处理后的所述内容关键词写入所述描述信息;利用预设的索引创建器将所述描述信息存入所述索引库,形成所述文件索引。5.根据权利要求4所述的方法,其特征在于,进一步包括:接收用户输入的文件删除请求;根据所述文件删除请求,从所述至少一个文件数据中确定待删除文件数据;确定所述待删除文件对应的待删除描述信息以及待删除文件索引;利用所述索引创建器将所述待删除描述信息以...

【专利技术属性】
技术研发人员:张迪崔俊啸臧德波蔺川景长超张鹏褚波
申请(专利权)人:浪潮通用软件有限公司
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1