索引结构的建立、关联检索方法、装置、设备及存储介质制造方法及图纸

技术编号:16546917 阅读:59 留言:0更新日期:2017-11-11 11:43
本发明专利技术实施例公开了一种倒排索引结构的建立、关联检索方法、装置、设备及存储介质。所述倒排索引结构的建立方法包括:将具有层级关系的上层文档数据以及下层文档数据分别存储于不同的存储空间中;根据所述上层文档数据以及所述下层文档数据之间的关联关系,建立用于进行关联检索的上层文档倒排表以及下层文档倒排表;其中,在所述上层文档倒排表中记录有与上层文档关联的下层文档的存储位置信息,在所述下层文档倒排表中记录有与下层文档关联的上层文档的存储位置信息。在保证不同层级的关联数据高性能检索的同时,尽可能的降低了数据的更新成本,优化了现有的数据检索技术,高效实现了对不同层级数据的关联检索。

Index structure establishment, association retrieval method, device, equipment and storage medium

The embodiment of the invention discloses the establishment of an inverted index structure, the association retrieval method, the device, the equipment and the storage medium. The inverted index built structure includes: the upper document data will have the hierarchy and the lower document data are stored in different storage space; according to the relationship between the upper and lower layer of the document data document data, set up for the document retrieval related upper and the lower inverted table document inverted list; among them, in the upper document inverted table records storage location information and the document associated lower level documents, storage location information in the lower level documents inverted list are documented in the upper and lower file associated with the document. To ensure the high performance of the associated data retrieval of different levels, reduce the update cost data as much as possible, to optimize the existing data retrieval technology, efficient implementation of the retrieval of data associated with different levels.

【技术实现步骤摘要】
索引结构的建立、关联检索方法、装置、设备及存储介质
本专利技术实施例涉及数据处理技术,尤其涉及一种倒排索引结构的建立、关联检索方法、装置、设备及存储介质。
技术介绍
随着O2O(OnlineToOffline,线上到线下)业务的不断发展,为了满足广大O2O用户的需求,大量传统的线下服务出现了相应的线上服务,不同于传统的线下预订服务,线上预订服务需要提供预定数据的检索功能,便于O2O用户快捷定位支持预订的线下实体服务平台。但是,一般的线下服务包括有两个或者两个以上层级的可选预定项目,例如:针对KTV的线上预定,用户一般需要选择KTV门店以及所需的包厢;针对餐厅的线上预定,用户一般需要选择餐厅门店以及所需的包厢等。因此,针对线上预定服务,如何实现一个既可以支持门店数据的智能排序,又支持门店以及下一层级项目之间的数据的条件筛选,并能快速响应检索请求的线上预定检索系统成了一个难题。
技术实现思路
本专利技术实施例提供了一种倒排索引结构的建立、关联检索方法、装置、设备及存储介质,以优化现有数据检索技术,实现对不同层级数据的关联检索。第一方面,本专利技术实施例提供了一种倒排索引结构的建立方法,包括:本文档来自技高网...
索引结构的建立、关联检索方法、装置、设备及存储介质

【技术保护点】
一种倒排索引结构的建立方法,其特征在于,包括:将具有层级关系的上层文档数据以及下层文档数据分别存储于不同的存储空间中;根据所述上层文档数据以及所述下层文档数据之间的关联关系,建立用于进行关联检索的上层文档倒排表以及下层文档倒排表;其中,在所述上层文档倒排表中记录有与上层文档关联的下层文档的存储位置信息,在所述下层文档倒排表中记录有与下层文档关联的上层文档的存储位置信息。

【技术特征摘要】
1.一种倒排索引结构的建立方法,其特征在于,包括:将具有层级关系的上层文档数据以及下层文档数据分别存储于不同的存储空间中;根据所述上层文档数据以及所述下层文档数据之间的关联关系,建立用于进行关联检索的上层文档倒排表以及下层文档倒排表;其中,在所述上层文档倒排表中记录有与上层文档关联的下层文档的存储位置信息,在所述下层文档倒排表中记录有与下层文档关联的上层文档的存储位置信息。2.根据权利要求1所述的方法,其特征在于:所述上层文档倒排表中包括:上层词条索引,以及与所述上层词条索引对应的上层文档记录序列,其中,在上层文档记录中存储有包括上层词条索引的目标上层文档的文档编号,以及与所述目标上层文档关联的下层文档信息;所述下层文档倒排表中包括:下层词条索引,以及与所述下层词条索引对应的下层文档记录序列,其中,在下层文档记录中存储有包括下层词条索引的目标下层文档的文档编号,以及与所述目标下层文档号关联的上层文档信息;其中,在所述存储空间中,不同文档对应不同的文档编号。3.根据权利要求2所述的方法,其特征在于:所述下层文档信息包括:下层文档的文档起始编号,以及编号偏移总量;所述上层文档信息包括:上层文档的文档编号。4.根据权利要求1所述的方法,其特征在于:将属于同一上层文档的至少一个下层文档连续存储于所述存储空间中连续的物理区块中;所述上层文档记录按照包括的上层文档的文档编号从小到大的顺序在所述上层文档记录序列中进行存放,所述下层文档记录按照包括的下层文档的文档编号从小到大的顺序在所述下层文档记录序列中进行存放。5.根据权利要求1所述的方法,其特征在于:所述上层文档数据为KTV门店数据,所述下层文档数据为KTV包厢数据。6.一种关联检索方法,应用通过权利要求1-5任一项所述的方法所建立的倒排索引结构,其特征在于,包括:解析用户输入的关联检索请求,获取与所述关联检索请求对应的数据筛选条件,其中,所述数据筛选条件包括:上层数据筛选条件,和/或下层数据筛选条件;根据所述数据筛选条件,查询所述倒排索引结构,获取与所述数据筛选条件对应的匹配上层文档编号集合,以及与匹配上层文档编号对应的匹配下层文档编号集合;按照设定排序算法对与所述匹配上层文档编号集合对应的匹配上层文档进行排序,并将排序结果结合与所述匹配下层文档编号集合对应的匹配下层文档进行显示。7.根据权利要求6所述的方法,其特征在于,所述数据筛选条件包括:上层数据筛选条件以及下层数据筛选条件;根据所述数据筛选条件,查询所述倒排索引结构,获取与所述数据筛选条件对应的匹配上层文档编号集合,以及与匹配上层文档编号对应的匹配下层文档编号集合,包括:根据与所述上层数据筛选条件对应的上层检索词条属性,查询所述倒排索引结构中的上层文档倒排表,获取与所述上层数据筛选条件对应的第一上层文档编号集合;根据与所述下层数据筛选条件对应的下层检索词条属性,查询所述倒排索引结构中的下层文档倒排表,获取与所述下层数据筛选条件对应的第一目标Map结构数据,其中,所述第一目标Map结构数据中的Key为上层文档编号,所述第一目标Map结构数据中的Value为与上层文档编号对应的下层文档编号集合;根据获取的所述第一上层文档编号集合以及所述第一目标Map结构数据,确定所述匹配上层文档编号集合,以及与匹配上层文档编号对应的匹配下层文档编号集合。8.根据权利要求7所述的方法,其特征在于,根据与所述上层数据筛选条件对应的上层检索词条属性,查询所述倒排索引结构中的上层文档倒排表,获取与所述上层数据筛选条件对应的第一上层文档编号集合,包括:根据与至少两个所述上层数据筛选条件分别对应的上层检索词条属性,查询所述倒排索引结构中的上层文档倒排表,获取与各所述上层数据筛选条件分别对应的上层文档编号集合;将获取的至少两个上层文档编号集合取交集,得到与所述上层数据筛选条件对应的第一上层文档编号集合。9.根据权利要求7所述的方法,其特征在于,根据与所述下层数据筛选条件对应的下层检索词条属性,查询所述倒排索引结构中的下层文档倒排表,获取与所述下层数据筛选条件对应的第一目标Map结构数据,包括:根据与至少两个所述下层数据筛选条件分别对应的下层检索词条属性,查询所述倒排索引结构中的下层文档倒排表,获取至少两个备选Map结构数据;对所述至少两个备选Map结构数据中的包括的各Key取交集,得到目标Key;将所述至少两个备选Map结构数据中包括与各目标Key分别对应的各Value取交集,得到目标Value;根据所述目标Key以及所述目...

【专利技术属性】
技术研发人员:李晓东邵军义罗雪峰吴少兵陈春筝
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1