System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于索引的查询方法及相关产品技术_技高网

基于索引的查询方法及相关产品技术

技术编号:40765902 阅读:3 留言:0更新日期:2024-03-25 20:16
本申请公开了一种基于索引的查询方法及相关产品。该方法包括:获得待查询文档的语义,生成与所述待查询文档语义匹配的目标相关词;将所述目标相关词作为所述待查询文档的索引项;在获得查询词后,在确定所述查询词与所述待查询文档的索引项匹配的情况下,确定所述待查询文档为所述查询词的查询结果。

【技术实现步骤摘要】

本申请涉及计算机,尤其涉及一种基于索引的查询方法及相关产品


技术介绍

1、通过对待查询文档库中的待查询文档进行周期性的特征提取处理,可得到待查询文档的特征向量。将该特征向量作为待查询文档的索引项,然后通过将查询词与待查询文档库中的索引项进行匹配,可从待查询文档中确定查询词的查询结果。但由于特征提取处理的频率低,为待查询文档库中的待查询文档生成索引项的速度慢,进而导致待查询文档难以被查询到。


技术实现思路

1、本申请提供一种基于索引的查询方法及相关产品,以提高待查询文档被查询到的几率。

2、第一方面,提供了一种基于索引的查询方法,所述方法包括:

3、获得待查询文档的语义,生成与所述待查询文档语义匹配的目标相关词;

4、将所述目标相关词作为所述待查询文档的索引项;

5、在获得查询词后,在确定所述查询词与所述待查询文档的索引项匹配的情况下,确定所述待查询文档为所述查询词的查询结果。

6、在该方面中,查询装置在获得待查询文档的语义的情况下,生成语义与待查询文档的语义匹配的目标相关词,然后将目标相关词作为待查询文档的索引项,可快速生成待查询文档的索引项。在获得查询词后,通过查询索引确定查询词与待查询文档的索引项匹配的情况下,可确定待查询文档为查询词的查询结果,由此可提高待查询文档被查询到的几率。

7、结合本申请任一实施方式,所述生成与所述待查询文档语义匹配的目标相关词,包括:

8、生成与所述待查询文档语义匹配的k个候选相关词;

9、从所述k个候选相关词中确定与所述待查询文档的相关性大于或等于相关性阈值的所述候选相关词作为所述目标相关词。

10、在该种实施方式中,查询词以相关性阈值为依据从k个候选相关词中确定与待查询文档的相关性高的候选词作为目标相关词,可提高目标相关词与待查询文档的相关性。

11、结合本申请任一实施方式,在所述生成与所述待查询文档语义匹配的k个候选相关词之后,在所述从所述k个候选相关词中确定与所述待查询文档的相关性大于或等于相关性阈值的所述候选相关词作为所述目标相关词之前,所述方法还包括:

12、利用相关性模型确定所述k个候选相关词与所述待查询文档的相关性。

13、在该种实施方式中,查询装置利用相关性模型可分别确定各个候选相关词与待查询文档的相关性。

14、结合本申请任一实施方式,所述生成与所述待查询文档语义匹配的k个候选相关词,包括:

15、利用序列到序列(sequence-to-sequence,seq2seq)模型对所述待查询文档的语义进行处理,生成与所述待查询文档语义匹配的所述k个候选相关词。

16、在该种实施方式中,查询装置利用seq2seq模型可通过对待查询文档的语义进行处理,生成与待查询文档语义匹配的k个候选相关词。

17、结合本申请任一实施方式,所述将所述目标相关词作为所述待查询文档的索引项之后,所述在确定所述查询词与所述待查询文档的索引项匹配的情况下,确定所述待查询文档为所述查询词的查询结果之前,所述方法还包括:

18、生成所述待查询文档与所述目标相关词的索引;

19、将所述索引添加至待查询文档库的查询索引,所述待查询文档属于所述待查询文档库。

20、在该种实施方式中,查询装置在生成待查询文档与目标相关词的索引的情况下,通过将该索引添加至待查询文档库的查询索引,使在对待查询文档库进行查询时,可查询到待查询文档。

21、结合本申请任一实施方式,所述确定所述查询词与所述待查询文档的索引项匹配,包括:

22、在检测到针对所述查询词的查询指令的情况下,通过将所述查询词与所述查询索引中的索引项进行匹配,确定所述查询词与所述待查询文档的索引项匹配;

23、在所述确定所述待查询文档为所述查询词的查询结果之后,所述方法还包括:

24、将所述待查询文档作为所述查询指令的查询结果。

25、在该种实施方式中,查询装置在检测到针对查询词的查询指令的情况下,可以查询词为依据对待查询文档库中的文档进行查询。具体的,查询装置将查询词与查询索引中的索引项进行匹配,以确定与查询词匹配的索引项。在确定查询词与待查询文档的索引项匹配的情况下,可进一步确定待查询文档为查询词的查询结果。

26、由于查询装置以查询词为依据对待查询文档库所做的查询,是针对查询指令所做的操作,查询装置在确定待查询文档为查询词的查询结果之后,可将待查询文档作为查询指令的查询结果。即通过该种实施方式,可确定针对查询词的查询指令的查询结果。

27、结合本申请任一实施方式,所述通过将所述查询词与所述查询索引中的索引项进行匹配,确定所述查询词与所述待查询文档的索引项匹配,包括:

28、在通过将所述查询词与所述查询索引中的索引项进行匹配,确定所述查询词与所述待查询文档的索引项的匹配度大于或等于匹配度阈值的情况下,确定所述查询词与所述待查询文档的索引项匹配。

29、在该种实施方式中,查询装置以匹配度阈值为依据,确定查询词与待查询文档的索引项匹配,可提高将待查询文档作为查询词的查询结果的准确度。

30、结合本申请任一实施方式,所述通过将所述查询词与所述查询索引中的索引项进行匹配,确定所述查询词与所述待查询文档的索引项匹配,包括:

31、在通过将所述查询词与所述查询索引中的索引项进行匹配,确定与所述查询词的匹配度最高的m个索引项包括所述待查询文档的索引项的情况下,确定所述查询词与所述待查询文档的索引项匹配,所述m为正整数。

32、在该种实施方式中,查询装置在确定与查询词的匹配度最高的m个索引项包括待查询文档的索引项的情况下,确定查询词与待查询文档的索引项匹配,可提高将待查询文档作为查询词的查询结果的准确度。

33、结合本申请任一实施方式,所述获得待查询文档的语义,生成与所述待查询文档语义匹配的目标相关词,包括:

34、在检测到针对所述待查询文档的发布指令的情况下,获得所述待查询文档的语义,生成与所述待查询文档语义匹配的目标相关词。

35、第二方面,提供了一种基于索引的查询装置。

36、生成单元,用于获得待查询文档的语义,生成与所述待查询文档语义匹配的目标相关词;

37、第一处理单元,用于将所述目标相关词作为所述待查询文档的索引项;

38、第二处理单元,用于在获得查询词后,在确定所述查询词与所述待查询文档的索引项匹配的情况下,确定所述待查询文档为所述查询词的查询结果。

39、结合本申请任一实施方式,所述生成单元,用于:

40、生成与所述待查询文档语义匹配的k个候选相关词;

41、从所述k个候选相关词中确定与所述待查询文档的相关性大于或等于相关性阈值的所述候选相关词作为所述目标相关词。

...

【技术保护点】

1.一种基于索引的查询方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述生成与所述待查询文档语义匹配的目标相关词,包括:

3.根据权利要求2所述的方法,其特征在于,在所述生成与所述待查询文档语义匹配的k个候选相关词之后,在所述从所述k个候选相关词中确定与所述待查询文档的相关性大于或等于相关性阈值的所述候选相关词作为所述目标相关词之前,所述方法还包括:

4.根据权利要求2或3所述的方法,其特征在于,所述生成与所述待查询文档语义匹配的k个候选相关词,包括:

5.根据权利要求1至3中任意一项所述的方法,其特征在于,所述将所述目标相关词作为所述待查询文档的索引项之后,所述在确定所述查询词与所述待查询文档的索引项匹配的情况下,确定所述待查询文档为所述查询词的查询结果之前,所述方法还包括:

6.根据权利要求5所述的方法,其特征在于,所述确定所述查询词与所述待查询文档的索引项匹配,包括:

7.根据权利要求5所述的方法,其特征在于,所述通过将所述查询词与所述查询索引中的索引项进行匹配,确定所述查询词与所述待查询文档的索引项匹配,包括:

8.根据权利要求5所述的方法,其特征在于,所述通过将所述查询词与所述查询索引中的索引项进行匹配,确定所述查询词与所述待查询文档的索引项匹配,包括:

9.根据权利要求1所述的方法,其特征在于,所述获得待查询文档的语义,生成与所述待查询文档语义匹配的目标相关词,包括:

10.一种基于索引的查询装置,其特征在于,所述装置包括:

11.一种电子设备,其特征在于,包括:处理器和存储器,所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令,在所述处理器执行所述计算机指令的情况下,所述电子设备执行如权利要求1至9中任意一项所述的方法。

12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,所述计算机程序包括程序指令,在所述程序指令被处理器执行的情况下,使所述处理器执行权利要求1至9中任意一项所述的方法。

...

【技术特征摘要】

1.一种基于索引的查询方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述生成与所述待查询文档语义匹配的目标相关词,包括:

3.根据权利要求2所述的方法,其特征在于,在所述生成与所述待查询文档语义匹配的k个候选相关词之后,在所述从所述k个候选相关词中确定与所述待查询文档的相关性大于或等于相关性阈值的所述候选相关词作为所述目标相关词之前,所述方法还包括:

4.根据权利要求2或3所述的方法,其特征在于,所述生成与所述待查询文档语义匹配的k个候选相关词,包括:

5.根据权利要求1至3中任意一项所述的方法,其特征在于,所述将所述目标相关词作为所述待查询文档的索引项之后,所述在确定所述查询词与所述待查询文档的索引项匹配的情况下,确定所述待查询文档为所述查询词的查询结果之前,所述方法还包括:

6.根据权利要求5所述的方法,其特征在于,所述确定所述查询词与所述待查询文档的索引项匹配,包括:

7.根据权利要求5所述的方法,其...

【专利技术属性】
技术研发人员:王树森
申请(专利权)人:小红书科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1