倒排索引表构建方法、资源检索方法、设备及存储介质技术

技术编号:33401715 阅读:16 留言:0更新日期:2022-05-11 23:23
本公开提供了一种倒排索表引构建方法、资源检索方法、设备及存储介质。倒排索引表构建方法包括:获取资源对应的子检出公式;基于子检出公式和对应的资源的标识构建第一子索引表,第一子索引表的表项包括子检出公式和对应的资源的标识;基于定向条件构建第一定向键值对;基于第一定向键值对和第一定向键值对对应的定向条件所属的子检出公式,构建第二子索引表,第二子索引表的表项包括定向键值和对应的定向条件所属的子检出公式。通过构建第一子索引表和第二子索引表构建倒排索引表,使得倒排索引表呈现二层结构,而不是建立第一定向键值对与资源的标识对应关系的一层倒排索引表,避免了常用键值对对应大量资源的标识造成的检索效率较低的问题。索效率较低的问题。索效率较低的问题。

【技术实现步骤摘要】
倒排索引表构建方法、资源检索方法、设备及存储介质


[0001]本公开涉及数据处理
,尤其涉及一种倒排索引表构建方法、资源检索方法、设备及存储介质。

技术介绍

[0002]倒排索引查找方法是基于倒排索引表进行资源的查找方法。相关技术中,倒排索引表中的每一表项均包括一个定向键值对和检出条件包括前述定向键值对对应的定向条件的资源的标识,其中某些资源对应的检出条件包括多个定向条件,并且多个定向条件之间为求与关系,因此采用倒叙。
[0003]在资源查找过程中,需要根据检索语句包括的定向条件确定对应的定向键值对,随后从倒排索引表中检索各个定向键值对对应的资源的标识;随后,再对基于各个定向键值对检索出的资源的标识确定最终可检出资源的标识。
[0004]采用基于前述倒排索引表的倒排索引查找方法,在资源数量很大的情况下,倒排索引表中的某些常用定向键值对对应大量资源的标识(也就是某些常用的查找项中包括大量资源的标识),使得检索效率较低。

技术实现思路

[0005]为了解决上述技术问题或者至少部分地解决上述技术问题,本公开提供了本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种倒排索引表构建方法,其特征在于,包括:获取资源对应的检出公式,其中所述检出公式包括至少一个子检出公式,所述子检出公式包括至少一个定向条件,所述子检出公式包括的所述定向条件之间为求与关系;基于所述子检出公式,以及所述子检出公式对应的资源的标识,构建第一子索引表,其中所述第一子索引表的表项包括所述子检出公式和所述子检出公式对应的资源的标识;基于所述定向条件构建第一定向键值对;基于所述第一定向键值对,以及所述第一定向键值对对应的定向条件所属的子检出公式,构建第二子索引表,其中所述第二子索引表的表项包括所述第一定向键值对,以及所述第一定向键值对对应的定向条件所属的子检出公式;采用所述第一子索引表和所述第二子索引表构成用于倒排检索的倒排索引表。2.根据权利要求1所述的方法,其特征在于,所述定向条件包括属性键和键值;所述基于所述定向条件构建第一定向键值对,包括:基于所述定向条件中的属性键和键值构建所述第一定向键值对。3.根据权利要求2所述的方法,其特征在于,所述定向条件还包括包含与否关系标识,所述包含与否关系标识是表示所述属性键是否包含所述键值的标识,所述包含与否关系标识为包含关系标识或者不包含关系标识;所述基于所述第一定向键值对,以及所述第一定向键值对对应的定向条件所属的子检出公式,构建第二子索引表,包括:基于所述第一定向键值对,所述第一定向键值对对应的定向条件包括的所述包含与否关系标识,以及所述第一定向键值对对应的定向条件所属的子检出公式,构建所述第二子索引表,以使所述第二子索引表的表项还包括所述包含与否关系标识。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:判断是否包括第一子检出公式,所述第一子检出公式是所有定向条件中的所述包含与否关系标识均为不包含关系标识的定向条件;在判定包括所述第一子检出公式的情况下,基于所述第一子检出公式包括的所述定向条件,在所述第二子索引表中添加特殊表项,所述特殊表项包括特殊属性键、所述第一子检出公式和包含关系标识。5.根据权利要求3或4所述的方法,其特征在于,所述基于所述第一定向键值对,所述第一定向键值对对应的定向条件包括的所述包含与否关系标识,以及所述第一定向键值对对应的定向条件所属的子检出公式,构建所述第二子索引表,包括:基于所述第一定向键值对,所述第一定向键值对对应的定向条件包括的所述包含与否关系标识,所述第一定向键值对对应的定向条件所属的子检出公式,以及所述子检出公式中的包含关系标识的数量,构建所述第二子索引表,以使所述第二子索引表的表项还包括所述包含关系标识的数量。6.根据权利要求4或5所述的方法,其特征在于,所述方法还包括:在所述第二子索引表包括所述特殊表项的情况下,将所述特殊表项的包含关系标识的数量设置为0。7.一种资源检索方法,其特征在于,基...

【专利技术属性】
技术研发人员:戴军
申请(专利权)人:掌阅科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1