一种数据索引建立方法、索引检索方法及装置制造方法及图纸

技术编号:21477230 阅读:40 留言:0更新日期:2019-06-29 04:44
本申请涉及数据存储和管理技术领域,尤其涉及一种数据索引建立方法、索引检索方法及装置,用以解决现有索引方式无法适用于海量数据环境下且很难实现高效率的批量删除的问题。本申请实施例提供的数据索引建立方法包括:提取待处理的数据文件中指定字段对应的字段值;生成包含有所述数据文件中指定字段对应的字段值与数据文件信息之间的关联关系的索引文件,其中,所述数据文件信息为数据文件名和/或数据文件存储位置。

【技术实现步骤摘要】
一种数据索引建立方法、索引检索方法及装置
本申请涉及数据存储和管理
,尤其涉及一种数据索引建立方法、索引检索方法及装置。
技术介绍
随着信息化的发展和大数据时代的来临,数据量呈爆炸式增长,为了支撑海量数据环境下数据的快速检索,数据索引的设计成为至关重要的环节。现有数据索引的建立多体现为关键词与具体记录的关系,用户可以输入某一关键词,在索引中查询到包含有该关键词的一条具体记录。比如,数据库中存储的一条信息为:“张三吃午饭”,那么在建立索引时,可以将“午饭”设置为关键词,后续可以输入“午饭”查找到具体记录为“张三吃午饭”。然而在海量数据环境下,若按照上述方法来为每个文件中的内容创建记录并建立索引,将索引指向每条记录的具体位置,可想而知所耗费的工作量是巨大的。并且,在海量数据环境下,由于数据量过大,一般只为近期的数据建立索引并进行缓存,同时将之前的存储的数据删除,而在删除数据时,还需查找索引中关键词对应的具体记录,然后逐条删除具体记录,故此,删除操作也需耗费很大的工作量,现有索引方式很难实现高效率地批量删除。综上,目前需要一种能够适用于海量数据环境下且支持高效率批量删除的索引建立方法本文档来自技高网...

【技术保护点】
1.一种数据索引建立方法,其特征在于,该方法包括:提取待处理的数据文件中指定字段对应的字段值;生成包含有所述数据文件中指定字段对应的字段值与数据文件信息之间的关联关系的索引文件,其中,所述数据文件信息为数据文件名和/或数据文件存储位置。

【技术特征摘要】
1.一种数据索引建立方法,其特征在于,该方法包括:提取待处理的数据文件中指定字段对应的字段值;生成包含有所述数据文件中指定字段对应的字段值与数据文件信息之间的关联关系的索引文件,其中,所述数据文件信息为数据文件名和/或数据文件存储位置。2.如权利要求1所述的方法,其特征在于,在提取待处理的数据文件中指定字段对应的字段值之后,所述方法还包括:针对每一个数据文件,生成包含有该数据文件中指定字段以及所述指定字段对应的字段值的有序表;所述生成包含有所述数据文件中指定字段对应的字段值与所述数据文件信息之间的关联关系的索引文件,包括:将各数据文件的有序表合并;将合并后的有序表中指定字段、字段值以及包含字段值的数据文件的数据文件信息关联存储在索引文件中。3.如权利要求2所述的方法,其特征在于,在生成包含有所述数据文件中指定字段对应的字段值与所述数据文件信息之间的关联关系的索引文件之后,所述方法还包括:判断内存中已缓存的索引文件量是否超出设定阈值;若是,则将内存中创建时间在指定时间范围的索引文件删除,并将新生成的索引文件存储在内存中;若否,则将新生成的索引文件存储在内存中。4.如权利要求3所述的方法,其特征在于,在将新生成的索引文件存储在内存中之后,所述方法还包括:将所述新生成的索引文件存储在磁盘中。5.一种索引检索方法,其特征在于,所述方法包括:接收终端发送的检索请求;所述检索请求中携带有以下检索条件中的一种:指定字段对应的字段值、指定字段对应的字段值范围、前缀检索条件;确定满足所述检索条件的索引文件;其中,所述索引文件中包含有数据文件中指定字段对应的字段值与数据文件信息之间的关联关系的索引文件,所述数据文件信息为数据文件名和/或数据文件存储位置;在满足检索条件的索引文件中,查找满足检索条件的字段值,并确定满足检索条件的字段值对应的数据文件信息;将确定的数据文件信息发送给所述终端。6.一种数据...

【专利技术属性】
技术研发人员:徐党生刘赫常剑飞辛术卞淑
申请(专利权)人:中国移动通信集团吉林有限公司中国移动通信集团公司
类型:发明
国别省市:吉林,22

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1