索引的处理方法及装置制造方法及图纸

技术编号：14239418 阅读：46 留言：0更新日期：2016-12-21 14:54

本发明专利技术提供一种索引的处理方法及装置，通过将服务器的所有内核划分为两个内核集合，限制读线程运行于第一内核集合中的内核，并限制写线程运行于第二内核集合中的内核，避免了由于写线程频繁修改cache中的数据，而导致对于读线程来说cache中所存储的数据命中率低的问题，提高了读线程在需要读取第一索引时，从cache中读取第一索引的概率，从而提高了查询效率。

Method and device for processing index

The present invention provides a method and a device for processing an index, through all divided into two core server kernel set limit read thread running on the first set of kernel in kernel, and limit the writing thread running on the second kernel set in the kernel, to avoid the write thread frequently modify data in cache, and lead to store read thread in the cache data hit rate is low, improves the reading thread in the need to read the first index, the probability index reads the first from the cache, thereby improving the query efficiency.

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及互联网
，尤其涉及一种索引的处理方法及装置。
技术介绍
服务器可以为用户提供发布信息功能以及查询信息功能。通常，服务器是通过索引的方式来管理文档，其中，索引指示了各关键词所对应的文档。现有技术中，服务器采用不同的线程来分别为用户提供查询信息功能和发布信息功能。具体的，通过读线程为用户提供查询信息功能，通过写线程为用户提供发布信息功能。对于查询信息功能，读线程需要根据索引来确定与用户输入的查询序列匹配的关键词，并根据所确定的关键词向用户返回对应的文档，因此读线程需要对索引进行读操作。对于发布信息功能，写线程需要确定用户所发布的文档中的关键词，在索引中写入所确定的关键词与所发布的文档的对应关系，因此写线程需要对索引进行写操作。其中，在读线程对索引进行读操作时，首先判断运行该读线程的内核的高速缓冲存储器(cache)中是否保存了该索引；若是，则直接从cache中读取该索引；否则，从内存中读取该索引，同时也将读取到的该索引存储在cache中，使得以后对该索引的读取可以直接从cache中获得。在写线程对索引进行写操作时，将待写入的数据写入到运行该写线程的内核的cache中。但是，现有技术中，存在查询效率较低的问题。
技术实现思路
本专利技术提供一种索引的处理方法及装置，用以解决现有技术中查询效率较低的问题。第一方面，本专利技术提供一种索引的处理方法，所述方法应用于服务器，所述服务器中的所有内核被划分为两个内核集合；其中，读线程运行在第一内核集合中的内核上，写线程运行在第二内核集合中的内核上，所述读线程用于为用户提供查询信息功能，所述写线程用于为用户...
索引的处理方法及装置

【技术保护点】
一种索引的处理方法，其特征在于，所述方法应用于服务器，所述服务器中的所有内核被划分为两个内核集合；其中，读线程运行在第一内核集合中的内核上，写线程运行在第二内核集合中的内核上，所述读线程用于为用户提供查询信息功能，所述写线程用于为用户提供发布信息功能；所述方法包括：所述读线程读取第一索引，所述第一索引用于指示关键词与文档标识的对应关系；所述读线程根据所述第一索引及用户输入的查询序列，确定与所述查询序列对应的文档标识。

【技术特征摘要】
1.一种索引的处理方法，其特征在于，所述方法应用于服务器，所述服务器中的所有内核被划分为两个内核集合；其中，读线程运行在第一内核集合中的内核上，写线程运行在第二内核集合中的内核上，所述读线程用于为用户提供查询信息功能，所述写线程用于为用户提供发布信息功能；所述方法包括：所述读线程读取第一索引，所述第一索引用于指示关键词与文档标识的对应关系；所述读线程根据所述第一索引及用户输入的查询序列，确定与所述查询序列对应的文档标识。2.根据权利要求1所述的方法，其特征在于，所述第一索引包括N个子索引，N为大于0的整数；所述N个子索引中的每一个子索引对应K个读线程，K为大于或等于0的整数；相应的，所述读线程读取第一索引，包括：第一读线程读取第一子索引；其中，所述第一读线程为所述第一子索引对应的读线程。3.根据权利要求2所述的方法，其特征在于，所述第一内核集合中的所有内核被划分为N个内核子集合，所述N个内核子集合中的每一个内核子集合与所述每一个子索引一一对应；所述每一个子索引对应的读线程运行在所述每一个子索引对应的内核子集合中的内核上。4.根据权利要求3所述的方法，其特征在于，所述读取索引之前，所述方法还包括：预估所述每一个子索引所需的内核数和线程数；根据所述每一个子索引所需的内核数，确定所述每一个子索引对应的内核子集合；根据所述每一个子索引所需的线程数，确定所述每一个子索引对应的读线程。5.根据权利要求1-4任一项所述的方法，其特征在于，所述方法还包括：所述写线程根据用户输入的待发布信息，对第二索引进行更新。6.一种索引的处理装置，其特征在于，所述装置为服务器或者所述装置...

【专利技术属性】
技术研发人员：吕静，
申请(专利权)人：五八同城信息技术有限公司，
类型：发明
国别省市：天津;12

全部详细技术资料下载我是这个专利的主人