倒排索引文件的存储方法和装置制造方法及图纸

技术编号:10694816 阅读:233 留言:0更新日期:2014-11-26 20:39
本发明专利技术公开了一种倒排索引文件的存储方法和装置。其中,该方法包括:在存储介质中创建用于存储倒排索引文件的倒排索引文件夹;为倒排索引文件夹设置阈值,阈值是创建新的倒排索引文件夹的判断条件;在倒排索引文件夹的属性超过阈值,创建用于存储倒排索引文件的新的倒排索引文件夹。本发明专利技术解决了现有技术由于倒排索引文件夹中倒排索引文件过多导致的该倒排索引文件夹读取速度过慢的技术问题。

【技术实现步骤摘要】
【专利摘要】本专利技术公开了一种倒排索引文件的存储方法和装置。其中,该方法包括:在存储介质中创建用于存储倒排索引文件的倒排索引文件夹;为倒排索引文件夹设置阈值,阈值是创建新的倒排索引文件夹的判断条件;在倒排索引文件夹的属性超过阈值,创建用于存储倒排索引文件的新的倒排索引文件夹。本专利技术解决了现有技术由于倒排索引文件夹中倒排索引文件过多导致的该倒排索引文件夹读取速度过慢的技术问题。【专利说明】倒排索引文件的存储方法和装置
本专利技术涉及计算机互联网领域,具体而言,涉及一种倒排索引文件的存储方法和 >J-U ρ?α装直。
技术介绍
目前,在关系数据库系统中,索引是检索数据最有效率的方式,。但对于拥有海量数据的关系数据库,单纯依靠索引对关系数据库中的数据进行检索的方式并不能满足对海量数据的检索速度的要求。 倒排索引的出现很好的解决了对于拥有海量数据的关系数据库的检索效率低的问题。倒排索引是一种索引方法,被用来存储在全文搜索下某个单词在一个文档或者一组文档中的存储位置的映射。它是文档检索系统中最常用的数据结构。通过倒排索引,可以根据单词快速获取包含这个单词的文档列表。 但是,随着关系数据库的使用,倒排索引文件数量也会跟着关系数据库中数据的增加而增加。当大量的倒排索引文件存储到同一个存储介质中的同一个倒排索引文件夹下时,随着倒排索引文件数量的增加,存储介质的寻址时间也会跟着相应的增长。从而使得该倒排索引文件夹中的倒排序索引文件的读取效率的降低。 针对现有技术中由于倒排索引文件夹中倒排索引文件过多导致的该倒排索引文件夹读取速度过慢的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术的主要目的在于提供一种倒排索引文件的存储方法和装置,以解决由于倒排索引文件夹中倒排索弓I文件过多导致的该倒排索弓I文件夹读取速度过慢的问题。 为了实现上述目的,根据本专利技术实施例的一个方面,提供了一种倒排索引文件的存储方法。根据本专利技术的倒排索引文件的存储方法包括:在存储介质中创建用于存储倒排索引文件的倒排索引文件夹;为倒排索引文件夹设置阈值,阈值是创建新的倒排索引文件夹的判断条件;在倒排索引文件夹的属性超过阈值,创建用于存储倒排索引文件的新的倒排索引文件夹。 为了实现上述目的,根据本专利技术实施例的另一方面,提供了一种倒排索引文件的存储装置。根据本专利技术的倒排索引文件的存储装置包括:存储模块,用于在存储介质中创建用于存储倒排索引文件的倒排索引文件夹;设置模块,用于为倒排索引文件夹设置阈值,阈值是创建新的倒排索引文件夹的判断条件;处理模块,用于在倒排索引文件夹的属性超过阈值,创建用于存储倒排索引文件的新的倒排索引文件夹。 根据专利技术实施例,通过在存储介质中创建用于存储倒排索引文件的倒排索引文件夹;为倒排索引文件夹设置阈值,阈值是创建新的倒排索引文件夹的判断条件;在倒排索引文件夹的属性超过阈值,创建用于存储倒排索引文件的新的倒排索引文件夹,解决了由于倒排索引文件夹中倒排索引文件过多导致的该倒排索引文件夹读取速度过慢的问题,达到了通过对倒排索引文件夹存储在多个倒排索引文件夹中,提高读取速度的效果。 【专利附图】【附图说明】 构成本申请的一部分的附图用来提供对本专利技术的进一步理解,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中: 图1是根据本专利技术实施例的一种倒排索引文件的存储方法的流程图; 图2是根据本专利技术实施例优选的一种倒排索引文件的存储方法的流程图; 图3是根据本专利技术实施例优选的一种倒排索引文件的存储方法的流程图; 图4是根据本专利技术实施例优选的一种倒排索引文件的存储方法的流程图; 图5是根据本专利技术实施例的一种倒排索引文件的存储装置的示意图; 图6是根据本专利技术实施例优选的一种倒排索引文件的存储装置的示意图; 图7是根据本专利技术实施例优选的一种倒排索引文件的存储装置的示意图;以及 图8是根据本专利技术实施例优选的一种倒排索引文件的存储装置的示意图; 【具体实施方式】 需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本专利技术。 为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。 需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。 本专利技术实施例提供了一种倒排索引文件的存储方法。 图1是根据本专利技术实施例的倒排索引文件的存储方法的流程图。如图1所示,该倒排索引文件的存储方法包括步骤如下: 步骤S102,在存储介质中创建用于存储倒排索引文件的倒排索引文件夹。 在上述步骤S102中,将大量数据记录的倒排索引写入倒排索引文件中,可以对上述倒排索引文件的大小进行限定,将所有索引文件设置成固定大小。并且将这些生成的倒排索引文件存入指定的倒排索弓I文件夹中。 步骤S104,为倒排索引文件夹设置阈值,阈值是创建新的倒排索引文件夹的判断条件。 在上述步骤S104中,对倒排索引文件夹设置阈值,阈值是作为监控是否生成新的倒排索引文件夹的判断标准。 步骤S106,在倒排索引文件夹的属性超过阈值,创建用于存储倒排索引文件的新的倒排索引文件夹。 在上述步骤S106中,通过对倒排索引文件夹进行监控,根据倒排索引文件夹的属性值与设定的阈值进行比较,当倒排索引文件夹的属性值超过设定的阈值时,生成用于存储倒排索引文件的新的倒排索引文件夹,并将新生成的倒排索引文件存入该新的倒排索引文件夹中。 上述步骤S102至步骤S106,通过对倒排索引文件夹属性和相关参数的监控,根据阈值的限制,来控制新生成的倒排索引文件的存储位置。从而避免倒排索引文件存储在在单一倒排索引文件夹中导致的文件夹读取性能降低的问题。 优选地,图2是根据本专利技术实施例优选的倒排索引文件的存储方法的流程图。如图2所示,本申请上述实施例中,在步骤S106为倒排索引文件夹设置阈值,阈值是创建新的倒排索引文件夹的判断条件中,当为倒排索引文件夹设置的阈值是对倒排索引文件夹中倒排索引文件数量设置的阈值时,在倒排索引文件夹的属性超过阈值,创建用于存储倒排索引文件的新的倒排索引文件夹的方法包括: 步骤S10611,获取倒排索引文件夹中倒排索引文件数量; 步骤S10613,对倒排索引文件夹中倒排索引文件数量与阈值进行比较; 步骤S10615,当倒排索引文件夹中倒排索引文件数量大于阈值时,创建用本文档来自技高网
...

【技术保护点】
一种倒排索引文件的存储方法,其特征在于,包括:在存储介质中创建用于存储倒排索引文件的倒排索引文件夹;为所述倒排索引文件夹设置阈值,所述阈值是创建新的倒排索引文件夹的判断条件;在所述倒排索引文件夹的属性超过所述阈值,创建用于存储所述倒排索引文件的所述新的倒排索引文件夹。

【技术特征摘要】

【专利技术属性】
技术研发人员:戴飞
申请(专利权)人:北京国双科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1