System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种文档检索方法、装置及相关设备制造方法及图纸_技高网

一种文档检索方法、装置及相关设备制造方法及图纸

技术编号:41185547 阅读:5 留言:0更新日期:2024-05-07 22:18
本申请提供一种文档检索方法、装置及相关设备,该方法根据目标文本的概要信息,确定目标文本的语义特征,根据语义特征,从文档库中确定第一预设数量的第一候选文档,再根据目标文本的文本内容,从文档库中确定第二预设数量的第二候选文档,最后根据第一候选文档和第二候选文档,确定目标文本的文档检索结果。本申请通过语义特征检索和全文检索分别得到与目标文本匹配的预设数量的候选文档,再对候选文档进行排序匹配确定出最终文档检索结果,相比传统的基于关键词匹配的方法,该方法文档检索结果的准确性、全面性和相关性更高,能够为用户提供更加个性化和精确的文档检索体验。

【技术实现步骤摘要】

本申请涉及信息检索,尤其涉及一种文档检索方法、装置及相关设备


技术介绍

1、在当前的信息时代,大量的文档和数据被产生和存储。然而,这么庞大的文档库使得用户在需要找到特定信息时面临着巨大的挑战。传统的文档检索方法主要依赖于关键词匹配或者统计方法,这种方法在一定程度上能够满足基本的检索需求,但往往无法准确地理解文档的语义和上下文信息,存在语义不一致、同义词、歧义等问题,导致检索结果的准确性和相关性不尽如人意。

2、因此,当前文档检索技术存在文档检索结果不精确的技术问题,需要改进。


技术实现思路

1、本申请实施例提供一种文档检索方法、装置及相关设备,用于缓解当前文档检索技术存在的文档检索结果不精确的技术问题。

2、为了解决上述技术问题,本申请实施例提供以下技术方案:

3、本申请提供一种文档检索方法,包括:

4、根据目标文本的概要信息,确定所述目标文本的语义特征;

5、根据所述语义特征,从文档库中确定第一预设数量的第一候选文档;

6、根据所述目标文本的文本内容,从所述文档库中确定第二预设数量的第二候选文档;

7、根据所述第一候选文档和所述第二候选文档,确定所述目标文本的文档检索结果。

8、在一种实施例中,在所述根据目标文本的摘要信息,确定所述目标文本的语义特征的步骤之前,还包括:

9、获取文档库;

10、对所述文档库中的文档进行概要提取,得到各文档的概要信息;

<p>11、对所述各文档的概要信息进行语义处理,得到各文档的语义特征。

12、在一种实施例中,所述根据所述语义特征,从文档库中确定第一预设数量的第一候选文档的步骤,包括:

13、获取所述目标文本的语义特征与所述文档库中各文档的语义特征之间的语义相似度参数;

14、根据所述语义相似度参数以及所述第一预设数量,确定所述第一候选文档。

15、在一种实施例中,所述根据所述语义相似度参数以及所述第一预设数量,确定所述第一候选文档的步骤,包括:

16、根据所述语义相似度参数,对所述文档库中的文档进行排序;

17、根据所述第一预设数量从所述排序结果中,确定所述第一候选文档。

18、在一种实施例中,所述根据所述目标文本的文本内容,从所述文档库中确定第二预设数量的第二候选文档的步骤,包括:

19、获取所述目标文本的文本内容与所述文档库中各文档的文本内容之间的文档相似度参数;

20、根据所述文档相似度参数以及所述第二预设数量,确定所述第二候选文档。

21、在一种实施例中,在所述根据所述第一候选文档和所述第二候选文档,确定所述目标文本的文档检索结果的步骤之后,还包括:

22、接收来自用户终端的响应操作;

23、根据所述响应操作确定响应信息;

24、根据所述响应信息对所述文档检索结果进行调整。

25、在一种实施例中,所述根据所述第一候选文档和所述第二候选文档,确定所述目标文本的文档检索结果的步骤,包括:

26、获取训练后的文档排序模型;

27、通过所述文档排序模型,对所述第一候选文档和所述第二候选文档进行排序,得到所述目标文本的文档检索结果。

28、同时,本申请提供一种文档检索装置,包括:

29、第一确定模块,用于根据目标文本的概要信息,确定所述目标文本的语义特征;

30、第二确定模块,用于根据所述语义特征,从文档库中确定第一预设数量的第一候选文档;

31、第三确定模块,用于根据所述目标文本的文本内容,从所述文档库中确定第二预设数量的第二候选文档;

32、第四确定模块,用于根据所述第一候选文档和所述第二候选文档,确定所述目标文本的文档检索结果。

33、同时,本申请提供一种计算机设备,其包括处理器和存储器,所述存储器存储有多条指令,所述指令适于所述处理器进行加载,以执行上述方法中的步骤。

34、同时,本申请提供一种计算机可读存储介质,所述计算机可读存储介质存储有多条指令,所述指令适于处理器进行加载,以执行上述方法中的步骤。

35、同时,本申请提供一种计算机软件,该计算机软件包括计算机指令,该计算机指令存储在计算机可读存储介质中;计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述方法中的步骤。

36、有益效果:本申请提供一种文档检索方法、装置及相关设备,该方法根据目标文本的概要信息,确定所述目标文本的语义特征,根据所述语义特征,从文档库中确定第一预设数量的第一候选文档,再根据所述目标文本的文本内容,从所述文档库中确定第二预设数量的第二候选文档,最后根据所述第一候选文档和所述第二候选文档,确定所述目标文本的文档检索结果。本申请通过语义特征检索和全文检索分别得到与目标文本匹配的预设数量的候选文档,再对候选文档进行排序匹配确定出最终文档检索结果,相比传统的基于关键词匹配的方法,该方法文档检索结果的准确性、全面性和相关性更高,能够为用户提供更加个性化和精确的文档检索体验。

本文档来自技高网
...

【技术保护点】

1.一种文档检索方法,其特征在于,包括:

2.根据权利要求1所述的文档检索方法,其特征在于,在所述根据目标文本的摘要信息,确定所述目标文本的语义特征的步骤之前,还包括:

3.根据权利要求2所述的文档检索方法,其特征在于,所述根据所述语义特征,从文档库中确定第一预设数量的第一候选文档的步骤,包括:

4.根据权利要求3所述的文档检索方法,其特征在于,所述根据所述语义相似度参数以及所述第一预设数量,确定所述第一候选文档的步骤,包括:

5.根据权利要求1所述的文档检索方法,其特征在于,所述根据所述目标文本的文本内容,从所述文档库中确定第二预设数量的第二候选文档的步骤,包括:

6.根据权利要求1所述的文档检索方法,其特征在于,在所述根据所述第一候选文档和所述第二候选文档,确定所述目标文本的文档检索结果的步骤之后,还包括:

7.根据权利要求1至6任一项所述的文档检索方法,其特征在于,所述根据所述第一候选文档和所述第二候选文档,确定所述目标文本的文档检索结果的步骤,包括:

8.一种文档检索装置,其特征在于,包括

9.一种计算机设备,其特征在于,包括处理器和存储器,所述存储器存储有多条指令,所述指令适于所述处理器进行加载,以执行如权利要求1至7中任一项所述的方法中的步骤。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有多条指令,所述指令适于处理器进行加载,以执行如权利要求1至7中任一项所述的方法中的步骤。

11.一种计算机软件,其特征在于,所述计算机软件包括计算机指令,所述计算机指令存储在计算机可读存储介质中;计算机设备的处理器从所述计算机可读存储介质读取所述计算机指令,所述处理器执行所述计算机指令,使得所述计算机设备执行如权利要求1至7中任一项所述的方法中的步骤。

...

【技术特征摘要】

1.一种文档检索方法,其特征在于,包括:

2.根据权利要求1所述的文档检索方法,其特征在于,在所述根据目标文本的摘要信息,确定所述目标文本的语义特征的步骤之前,还包括:

3.根据权利要求2所述的文档检索方法,其特征在于,所述根据所述语义特征,从文档库中确定第一预设数量的第一候选文档的步骤,包括:

4.根据权利要求3所述的文档检索方法,其特征在于,所述根据所述语义相似度参数以及所述第一预设数量,确定所述第一候选文档的步骤,包括:

5.根据权利要求1所述的文档检索方法,其特征在于,所述根据所述目标文本的文本内容,从所述文档库中确定第二预设数量的第二候选文档的步骤,包括:

6.根据权利要求1所述的文档检索方法,其特征在于,在所述根据所述第一候选文档和所述第二候选文档,确定所述目标文本的文档检索结果的步骤之后,还包括:

7.根据权利要求...

【专利技术属性】
技术研发人员:廖宇康
申请(专利权)人:北京中关村科金技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1