一种分散键值的索引建立方法及系统技术方案

技术编号:14455607 阅读:132 留言:0更新日期:2017-01-19 04:18
本发明专利技术公开了一种分散键值的索引建立方法及系统,包括:根据源文本的内容信息及预定拆分规则,从所述源文本中拆分出对应的关键字索引;按照预定的划分规则划分所述关键字索引,生成与所述划分规则对应的不同的索引集合;根据预定的排序规则,将每个索引集合中的索引进行排序,并将排序后的每个索引集合存储在不同的索引区域;可见,在本实施例中,通过对索引按预定规则划分,存储在不同的索引区域,在搜索索引时能快速的定位,提升搜索性能。

【技术实现步骤摘要】

本专利技术涉及索引建立
,更具体地说,涉及一种分散键值的索引建立方法及系统。
技术介绍
在当前的互联网以及大数据技术飞速发展的情况下,数据存储越来越大,同样的,对于用户操作的体验性要求也越来越高,尤其是内容搜索,尤为重要,大部分的互联网使用者以及信息系统的使用者对于搜索功能的要求是越来越高,要求内容的响应时间也越来越短,所以对于搜索性能的提示也越来越重要。因此,提高搜索性能是本领域技术人员需要解决的问题。
技术实现思路
本专利技术的目的在于提供一种分散键值的索引建立方法及系统,以实现提高搜索性能。为实现上述目的,本专利技术实施例提供了如下技术方案:一种分散键值的索引建立方法,包括:根据源文本的内容信息及预定拆分规则,从所述源文本中拆分出对应的关键字索引;按照预定的划分规则划分所述关键字索引,生成与所述划分规则对应的不同的索引集合;根据预定的排序规则,将每个索引集合中的索引进行排序,并将排序后的每个索引集合存储在不同的索引区域。其中,所述按照预定的划分规则划分所述关键字索引,生成与所述划分规则对应的不同的索引集合,包括:解析所述关键字索引的关键字类型;匹配与所述关键字类型对应的划分规则,并按照所述划分规则将所述关键字索引进行划分,生成不同的索引集合。其中,按照所述划分规则将所述关键字索引进行划分,生成不同的索引集合,包括:若所述划分规则为字母划分规则,则根据所述字母划分规则对所述关键字索引进行划分,生成与不同字母对应的索引集合。其中,按照所述划分规则将所述关键字索引进行划分,生成不同的索引集合,包括:若所述划分规则为笔画划分规则,则根据所述笔画划分规则对所述关键字索引进行划分,生成与笔画数对应的索引集合。其中,还包括:接收到目标源文本查询指令后,按照预定拆分规则从所述目标源文本查询指令中拆分出查询索引;根据所述预定的划分规则及所述查询索引,从所述不同的索引区域中匹配出与所述查询索引对应的目标关键字索引,并根据与所述目标关键索引与目标源文本的对应关系,查询所述目标源文本的内容信息。一种分散键值的索引建立系统,包括:关键字索引拆分模块,用于根据源文本的内容信息及预定拆分规则,从所述源文本中拆分出对应的关键字索引;索引集合生成模块,用于按照预定的划分规则划分所述关键字索引,生成与所述划分规则对应的不同的索引集合;索引集合处理模块,用于根据预定的排序规则,将每个索引集合中的索引进行排序,并将排序后的每个索引集合存储在不同的索引区域。其中,所述索引集合生成模块包括:解析单元,用于解析所述关键字索引的关键字类型;索引集合划分单元,用于匹配与所述关键字类型对应的划分规则,并按照所述划分规则将所述关键字索引进行划分,生成不同的索引集合。其中,若所述划分规则为字母划分规则,则所述索引集合划分单元根据所述字母划分规则对所述关键字索引进行划分,生成与不同字母对应的索引集合。其中,若所述划分规则为笔画划分规则,则所述索引集合划分单元根据所述笔画划分规则对所述关键字索引进行划分,生成与笔画数对应的索引集合。其中,所述关键字索引拆分模块还用于接收到目标源文本查询指令后,按照预定拆分规则从所述目标源文本查询指令中拆分出查询索引;所述索引建立系统还包括:关键字索引匹配模块,用于根据所述预定的划分规则及所述查询索引,从所述不同的索引区域中匹配出与所述查询索引对应的目标关键字索引;源文本内容查询模块,用于根据与所述目标关键索引与目标源文本的对应关系,查询所述目标源文本的内容信息。通过以上方案可知,本专利技术实施例提供的一种分散键值的索引建立方法及系统,包括:根据源文本的内容信息及预定拆分规则,从所述源文本中拆分出对应的关键字索引;按照预定的划分规则划分所述关键字索引,生成与所述划分规则对应的不同的索引集合;根据预定的排序规则,将每个索引集合中的索引进行排序,并将排序后的每个索引集合存储在不同的索引区域;可见,在本实施例中,通过对索引按预定规则划分,存储在不同的索引区域,在搜索索引时能快速的定位,提升搜索性能。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例公开的一种分散键值的索引建立方法流程示意图;图2为本专利技术实施例公开的索引的分散存储示意图;图3为本专利技术实施例公开的一种分散键值的索引建立系统结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术实施例公开了一种分散键值的索引建立方法及系统,以实现提高搜索性能。参见图1,本专利技术实施例提供的一种分散键值的索引建立方法,包括:S101、根据源文本的内容信息及预定拆分规则,从所述源文本中拆分出对应的关键字索引;S102、按照预定的划分规则划分所述关键字索引,生成与所述划分规则对应的不同的索引集合;其中,所述按照预定的划分规则划分所述关键字索引,生成与所述划分规则对应的不同的索引集合,包括:解析所述关键字索引的关键字类型;匹配与所述关键字类型对应的划分规则,并按照所述划分规则将所述关键字索引进行划分,生成不同的索引集合。其中,按照所述划分规则将所述关键字索引进行划分,生成不同的索引集合,包括:若所述划分规则为字母划分规则,则根据所述字母划分规则对所述关键字索引进行划分,生成与不同字母对应的索引集合;若所述划分规则为笔画划分规则,则根据所述笔画划分规则对所述关键字索引进行划分,生成与笔画数对应的索引集合。具体的,在本方案可以按照预定的划分规则对索引进行分散存储,如按照词组进行分类、按照首字母进行分类等多种规则进行分散存储,这里预定规则的选取可以在使用之前通过系统进行设定,也可以在系统中设定多种规则,通过对关键词索引的类型的分析,选取合适的划分规则。S103、根据预定的排序规则,将每个索引集合中的索引进行排序,并将排序后的每个索引集合存储在不同的索引区域。具体的,在本方案中,根据拆分出来的索引集合按照排序规则进行排序划分数据块,然后进行索引的规划和以及按照规划进行分散存储,使属于相同规则的内容存储在同一区域或者逻辑位置;例如,若划分规则为字母划分规则,那么,并将首字母属于同一字母的作为一个索引集合,并将不同的索引集合存储在不同的区域或者逻辑位置。参见图2,将不同的索引集合存储在不同的索引区块上,每个索引区块上的索引可以按照排序规则进行排序,这里的排序规则可以和划分规则相同;例如:划分规则为首字母划分,那么这里的排序规则可以根据第二个字母的顺序进行划分。基于上述技术方案,本方案还包括:接收到目标源文本查询指令后,按照预定拆分规则从所述目标源文本查询指令中拆分出查询索引;根据所述预定的划分规则及所述查询索引,从所述不同的索引区域中匹配出与所述查询索引对应的目标关键字索引,并根据与所述目标关键索引与目标源文本的对应关系,查询所述目标源文本的内容本文档来自技高网...

【技术保护点】
一种分散键值的索引建立方法,其特征在于,包括:根据源文本的内容信息及预定拆分规则,从所述源文本中拆分出对应的关键字索引;按照预定的划分规则划分所述关键字索引,生成与所述划分规则对应的不同的索引集合;根据预定的排序规则,将每个索引集合中的索引进行排序,并将排序后的每个索引集合存储在不同的索引区域。

【技术特征摘要】
1.一种分散键值的索引建立方法,其特征在于,包括:根据源文本的内容信息及预定拆分规则,从所述源文本中拆分出对应的关键字索引;按照预定的划分规则划分所述关键字索引,生成与所述划分规则对应的不同的索引集合;根据预定的排序规则,将每个索引集合中的索引进行排序,并将排序后的每个索引集合存储在不同的索引区域。2.根据权利要求1所述的索引建立方法,其特征在于,所述按照预定的划分规则划分所述关键字索引,生成与所述划分规则对应的不同的索引集合,包括:解析所述关键字索引的关键字类型;匹配与所述关键字类型对应的划分规则,并按照所述划分规则将所述关键字索引进行划分,生成不同的索引集合。3.根据权利要求2所述的索引建立方法,其特征在于,按照所述划分规则将所述关键字索引进行划分,生成不同的索引集合,包括:若所述划分规则为字母划分规则,则根据所述字母划分规则对所述关键字索引进行划分,生成与不同字母对应的索引集合。4.根据权利要求2所述的索引建立方法,其特征在于,按照所述划分规则将所述关键字索引进行划分,生成不同的索引集合,包括:若所述划分规则为笔画划分规则,则根据所述笔画划分规则对所述关键字索引进行划分,生成与笔画数对应的索引集合。5.根据权利要求1-4中任意一项所述的索引建立方法,其特征在于,还包括:接收到目标源文本查询指令后,按照预定拆分规则从所述目标源文本查询指令中拆分出查询索引;根据所述预定的划分规则及所述查询索引,从所述不同的索引区域中匹配出与所述查询索引对应的目标关键字索引,并根据与所述目标关键索引与目标源文本的对应关系,查询所述目标源文本的内容信息。6.一种分散键值的...

【专利技术属性】
技术研发人员:张凯顺李震宇
申请(专利权)人:浪潮北京电子信息产业有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1