一种实时搜索的方法技术

技术编号：7898254 阅读：184 留言：0更新日期：2012-10-23 04:24

本发明专利技术提供了一种实时搜索的方法，该方法包括以下步骤：将数据文档按照时间顺序生成多段索引；从各索引段中提取部分数据，予以缓存，其中，根据各段的生成时间确定提取该段进行缓存的数据量；搜索数据时，先从缓存中搜索各索引段的文档，缓存中存在目标数据时，则返回目标数据；否则，从其他存储单元中搜索数据；将从缓存所搜索的目标数据和/或从存储单元中所搜索的目标数据予以合并，返回合并的数据。本发明专利技术提供的方案针对不同时间段的数据，采用不同的缓存方案，提高了实时搜索的效率和灵活性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及搜索技术，尤其涉及。
技术介绍
互联网的飞速发展，给搜索引擎提出了新的难题，由于网络信息的爆炸性增长，大规模的web搜索引擎平均每秒需要处理上万次搜索请求，每个搜索的处理需要涉及到海量的索引，因此，索引处理已经成为搜索引擎的主要的性能瓶颈。现有的搜索方案中，对于实时搜索，虽然可以一边提供查询的功能，一边提供修改的数据排序字段，例如一张员工数据表中，存储了员工的编号、姓名、工作日期共三个字段的信息，而索引是按照“编号”的排序字段进行建立的，则用户需要查询以“工作日期”为排序字段的前十名员工的信息，则可以一边返回查询的数据给用户，一边修改数据的排序字段，以便于下次较快地返回以“工作日期”为排序字段的所有员工的信息，但是，由于没有适用缓存，针对每一次新的搜索请求，都需要从索引中检索数据，并对索引中的数据进行重新排序，由此，延长了数据搜索的时间，降低了搜索系统的性能。
技术实现思路
根据对大量用户的搜索习惯和规律进行调查发现，在一段时间内大量用户会对一些当前热门关键词进行搜索，而搜索过程中生成的索引和搜索结果在预定时间内是保持不变。如果能够充分利用先前已经形成的索引和搜索结果可以减少为相同的搜索请求重复生成搜索结果的服务器时间和负荷。为此本专利技术的目的是提供，该方法包括以下步骤将数据文档按照时间顺序生成多段索引；从各索引段中提取部分数据，予以缓存，其中，根据各段的生成时间确定提取该段进行缓存的数据量；搜索数据时，先从缓存中搜索各索弓I段的文档，缓存中存在目标数据时，则返回目标数据；否则，从其他存储单元中搜索数据；将从缓存所搜索的目标数据和/或从存储...

【技术保护点】
一种实时搜索的方法，该方法包括以下步骤：将数据文档按照时间顺序生成多段索引；从各索引段中提取部分数据，予以缓存，其中，根据各段的生成时间确定提取该段进行缓存的数据量；搜索数据时，先从缓存中搜索各索引段的文档，缓存中存在目标数据时，则返回目标数据；否则，从其他存储单元中搜索数据；将从缓存所搜索的目标数据和/或从存储单元中所搜索的目标数据予以合并，返回合并的数据。

【技术特征摘要】

【专利技术属性】
技术研发人员：龚伟坚，孙海涛，崔金峰，
申请(专利权)人：北京城市网邻信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人