构建索引的方法、检索方法、装置及系统制造方法及图纸

技术编号:8241533 阅读:149 留言:0更新日期:2013-01-24 22:27
本发明专利技术公开了一种构建索引的方法、检索方法、装置及系统,属于检索技术领域。构建索引的方法包括:将每个预设时间段内获取到的数据各自构建成一个初级索引段,并在每个预设时间段结束后,将构建的初级索引段合并到初级索引段集合中;复制初级索引段集合中的各个初级索引段,并将其合并到对应的大索引段中,得到大索引段集合;将初级索引段集合中的初级索引段或大索引段集合中的大索引段发送给检索装置,以用于提供检索服务。本发明专利技术通过基于时间构建初级索引段,并将构建的初级索引段合并到大索引段,由初级索引段或大索引段同时提供检索服务,从而提高检索速度;另外,在合并索引段时,通过与空闲内存相连的索引段进行合并,进而提高内存利用率。

【技术实现步骤摘要】
构建索引的方法、检索方法、装置及系统
本专利技术涉及检索
,特别涉及一种构建索引的方法、检索方法、装置及系统。
技术介绍
随着网络的普及,信息量的日益增加,检索技术的应用范围越来越广。为了实现检索,需要预先将数据构建成索引,再根据预先构建的索引进行检索,因而构建索引的方式,可决定检索的速度。现有技术中,构建索引的方式是根据文件大小建立一大一小两个索引段,新数据实时合并到小索引段里面,并且在某些时刻把大索引段和小索引段合并成一个新的大索引段,在检索时,同时检索大索引段和小索引段,然后合并二者的结果。在实现本专利技术的过程中,专利技术人发现现有技术至少存在以下缺点:由于现有技术需要将新数据和小索引段合并,再将小索引段与大索引段合并后才能提供检索服务,从而影响检索速度,且在纯内存环境下,现有技术提供的构建索引的方式及检索的方式通常还需要额外的内存,导致内存的有效利用率不高。
技术实现思路
为了在提高检索速度的同时,提高内存利用率,本专利技术实施例提供了一种构建索引的方法、检索方法、装置及系统。所述技术方案如下:一方面,提供了一种构建索引的方法,所述方法包括:将每个预设时间段内获取到的数据本文档来自技高网...
构建索引的方法、检索方法、装置及系统

【技术保护点】
一种构建索引的方法,其特征在于,所述方法包括:将每个预设时间段内获取到的数据各自构建成一个初级索引段,并在每个预设时间段结束后,将构建的初级索引段合并到初级索引段集合中;复制所述初级索引段集合中的各个初级索引段,并将其合并到对应的大索引段中,得到大索引段集合;将所述初级索引段集合中的初级索引段或所述大索引段集合中的大索引段发送给检索装置,以用于提供检索服务。

【技术特征摘要】
1.一种构建索引的方法,其特征在于,所述方法包括:将每个预设时间段内获取到的数据各自构建成一个初级索引段,并在每个预设时间段结束后,将构建的初级索引段合并到初级索引段集合中;按时间顺序依次复制所述初级索引段集合中的各个初级索引段,并将复制的初级索引段合并到对应的大索引段中,所述对应的大索引段为所述大索引段集合中与空闲内存相连的大索引段;将所述初级索引段集合中的初级索引段或所述大索引段集合中的大索引段发送给检索装置,以用于提供检索服务。2.根据权利要求1所述的方法,其特征在于,所述将构建的初级索引段合并到初级索引段集合中之后,还包括:每隔预设周期,删除所述初级索引段集合中的在预设周期之前构建的初级索引段。3.根据权利要求1所述的方法,其特征在于,所述按时间顺序依次复制所述初级索引段集合中的各个初级索引段,并将复制的初级索引段合并到对应的大索引段中,所述对应的大索引段为所述大索引段集合中与空闲内存相连的大索引段之后,还包括:将所述大索引段集合中的各个大索引段进行备份。4.根据权利要求1至权利要求3中任一权利要求所述的方法,其特征在于,所述初级索引段和大索引段中均包括一个序列号值和一个是否完整的标志;相应地,所述复制所述初级索引段集合中的各个初级索引段,并将其合并到对应的大索引段中时,合并后的大索引段的序列号值为合并时的初级索引段的序列号值和大索引段的序列号值中的较大序列号值;相应地,所述将所述初级索引段集合中的初级索引段或所述大索引段集合中的大索引段发送给检索装置,具体包括:接收所述检索装置发送的索引段申请,所述申请中携带序列号值和是否完整的标志;根据所述申请中携带的序列号值和是否完整的标志向所述检索装置发送对应的索引段,所述对应的索引段为所述初级索引段集合中的初级索引段或所述大索引段集合中的大索引段。5.根据权利要求4所述的方法,其特征在于,所述根据所述申请中携带的序列号值和是否完整的标志向所述检索装置返回对应的索引段,具体包括:如果所述申请中携带的序列号值为空,则读取已备份的索引段,并将其发送给所述检索装置;或者,如果所述申请中携带的序列号值为非空,且所述申请中携带不完整的标志,则将序列号值与所述申请中携带的序列号值相同的索引段返回给所述检索装置;或者,如果所述申请中携带的序列号值为非空,且所述申请中携带完整的标志,则将序列号值为所述申请中携带的序列号值的下一个序列号值的索引段返回给所述检索装置。6.一种构建索引的装置,其特征在于,所述装置包括:构建模块,用于将每个预设时间段内获取到的数据各自构建成一个初级索引段,并在每个预设时间段结束后,将构建的初级索引段合并到初级索引段集合中;合并模块,用于按时间顺序依次复制所述初级索引段集合中的各个初级索引段,并将复制的初级索引段合并到对应的大索引段中,所述对应的大索引段为所述大索引段集合中与空闲内存相连的大索引段;发送模块,用于将所述构建模块得到的初级索引段集合中的初级索引段或所述合并模块得到的大索引段集合中的大索引段发送给检索装置,以用于提供检索服务。7.根据权利要求6所述的装置,其特征在于,所述装置,还包括:删除模块,用于在所述构建模块将构建的初级索引段合并到初级索引段集合之后,每隔预设周期,删除所述初级索引段集合中的在预设周期之前构建的初级索引段。8.根据权利要求6所述的装置,其特征在于,所述装置,还包括:备份模块,用于在所述合并模块复制所述构建模块得到的初级索引段集合中的各个初级索引段,并将其合并到对应的大索引段中,得到大索引段集合之后,将所述大索引段集合中的各个大索引段进行备份。9.根据权利要求6至权利要求8中任一权利要求所述的装置,其特征在于,所述构建模块构建的初级索引段和所述合并模块合并得到的大索引段中均包括一个序列号值和一个是否完整的标志;相应地,所述合并模块复制所述构建模块得到的初级索引段集合中的各个初级索引段,并将其合并到对应...

【专利技术属性】
技术研发人员:朱正平马超沈妍
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1