System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 文档检索方法以及自动问答方法技术_技高网

文档检索方法以及自动问答方法技术

技术编号:40461407 阅读:7 留言:0更新日期:2024-02-22 23:16
本说明书实施例提供文档检索方法以及自动问答方法,其中所述文档检索方法包括:获取待检索数据;根据待检索数据,从知识库的多个文档中检索得到至少一个候选文档;根据待检索数据和至少一个候选文档之间的关联关系,从至少一个候选文档中筛选出至少一个参考文档;根据至少一个参考文档对待检索数据进行更新,获得更新后的待检索数据,并利用更新后的待检索数据,从多个文档中检索得到目标文档。通过粗排检索和精排检索得到参考文档,保证了参考文档的准确性,利用参考文档对待检索数据进行更新,实现了检索链路上的正负向反馈交互,使得待检索数据更加精准,有效解决了因表达多样性以及间接性导致的检索错误,提高了文档检索的准确性。

【技术实现步骤摘要】

本说明书实施例涉及计算机,特别涉及文档检索方法以及自动问答方法


技术介绍

1、随着计算机技术的发展,自动化的文档检索(document retrieval)逐渐成为研究重点。文档检索是指在大量的文档集合中,通过用户输入的查询条件来查找并返回与之相关的信息的过程。

2、目前,检索链路经常受到两类问题的困扰,一是表述多样性问题,即用户输入的查询条件和知识库中对于同一对象的表述存在差异;二是逻辑推理问题,即用户输入的查询条件在知识库中不存在直接答案,必须通过推理间接推断。上述两类问题导致文档检索的准确性极差,因此,亟需一种准确性高的文档检索方案。


技术实现思路

1、有鉴于此,本说明书实施例提供了一种文档检索方法。本说明书一个或者多个实施例同时涉及一种自动问答方法,一种文档检索装置,一种自动问答装置,一种计算设备,一种计算机可读存储介质以及一种计算机程序,以解决现有技术中存在的技术缺陷。

2、根据本说明书实施例的第一方面,提供了一种文档检索方法,包括:

3、获取待检索数据;

4、根据待检索数据,从知识库的多个文档中检索得到至少一个候选文档;

5、根据待检索数据和至少一个候选文档之间的关联关系,从至少一个候选文档中筛选出至少一个参考文档;

6、根据至少一个参考文档对待检索数据进行更新,获得更新后的待检索数据,并利用更新后的待检索数据,从多个文档中检索得到目标文档。

7、根据本说明书实施例的第二方面,提供了一种自动问答方法,包括:

8、获取待回答问题;

9、根据待回答问题,从知识库的多个文档中检索得到至少一个候选文档;

10、根据待回答问题和至少一个候选文档之间的关联关系,从至少一个候选文档中筛选出至少一个参考文档;

11、根据至少一个参考文档对待回答问题进行更新,获得更新后的待回答问题,并利用更新后的待回答问题,从多个文档中检索得到目标文档;

12、根据目标文档,生成待回答问题对应的答复结果。

13、根据本说明书实施例的第三方面,提供了一种文档检索装置,包括:

14、第一获取模块,被配置为获取待检索数据;

15、第一检索模块,被配置为根据待检索数据,从知识库的多个文档中检索得到至少一个候选文档;

16、第一筛选模块,被配置为根据待检索数据和至少一个候选文档之间的关联关系,从至少一个候选文档中筛选出至少一个参考文档;

17、第二检索模块,被配置为根据至少一个参考文档对待检索数据进行更新,获得更新后的待检索数据,并利用更新后的待检索数据,从多个文档中检索得到目标文档。

18、根据本说明书实施例的第四方面,提供了一种自动问答装置,包括:

19、第二获取模块,被配置为获取待回答问题;

20、第三检索模块,被配置为根据待回答问题,从知识库的多个文档中检索得到至少一个候选文档;

21、第二筛选模块,被配置为根据待回答问题和至少一个候选文档之间的关联关系,从至少一个候选文档中筛选出至少一个参考文档;

22、第四检索模块,被配置为根据至少一个参考文档对待回答问题进行更新,获得更新后的待回答问题,并利用更新后的待回答问题,从多个文档中检索得到目标文档;

23、第一生成模块,被配置为根据目标文档,生成待回答问题对应的答复结果。

24、根据本说明书实施例的第五方面,提供了一种计算设备,包括:

25、存储器和处理器;

26、所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,该计算机可执行指令被处理器执行时实现上述第一方面或者第二方面所提供方法的步骤。

27、根据本说明书实施例的第六方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现上述第一方面或者第二方面所提供方法的步骤。

28、根据本说明书实施例的第七方面,提供了一种计算机程序,其中,当所述计算机程序在计算机中执行时,令计算机执行上述第一方面或者第二方面所提供方法的步骤。

29、本说明书一个实施例提供的文档检索方法,包括:获取待检索数据;根据待检索数据,从知识库的多个文档中检索得到至少一个候选文档;根据待检索数据和至少一个候选文档之间的关联关系,从至少一个候选文档中筛选出至少一个参考文档;根据至少一个参考文档对待检索数据进行更新,获得更新后的待检索数据,并利用更新后的待检索数据,从多个文档中检索得到目标文档。通过从多个文档中粗排检索得到候选文档,进一步从候选文档中精排检索得到参考文档,保证了参考文档的准确性,并且,利用参考文档对待检索数据进行更新,实现了检索链路上的正负向反馈交互,使得待检索数据更加精准,有效解决了因表达多样性以及间接性导致的检索错误,提高了文档检索的准确性。

本文档来自技高网...

【技术保护点】

1.一种文档检索方法,包括:

2.根据权利要求1所述的方法,所述根据所述待检索数据和所述至少一个候选文档之间的关联关系,从所述至少一个候选文档中筛选出至少一个参考文档,包括:

3.根据权利要求2所述的方法,所述将所述待检索数据和所述第一候选文档输入关系确定模型,获得所述第一候选文档对应的关系指标之后,还包括:

4.根据权利要求2所述的方法,所述针对第一候选文档,将所述待检索数据和所述第一候选文档输入关系确定模型,获得所述第一候选文档对应的关系指标之后,还包括:

5.根据权利要求1所述的方法,所述根据所述至少一个参考文档对所述待检索数据进行更新,获得更新后的待检索数据,并利用所述更新后的待检索数据,从所述多个文档中检索得到目标文档之后,还包括:

6.根据权利要求1所述的方法,所述根据所述至少一个参考文档对所述待检索数据进行更新,获得更新后的待检索数据,并利用所述更新后的待检索数据,从所述多个文档中检索得到目标文档,包括:

7.根据权利要求6所述的方法,所述根据所述更新后的待检索数据,从所述多个文档中检索得到更新后的至少一个候选文档之后,还包括:

8.根据权利要求7所述的方法,所述在所述更新后的至少一个候选文档中不包括目标候选文档的情况下,返回执行所述根据所述待检索数据和所述至少一个候选文档之间的关联关系,从所述至少一个候选文档中筛选出至少一个参考文档的步骤之后,还包括:

9.根据权利要求1所述的方法,所述根据所述待检索数据,从知识库的多个文档中检索得到至少一个候选文档,包括:

10.根据权利要求1所述的方法,所述获取待检索数据,包括:

11.根据权利要求10所述的方法,所述根据所述待检索问题、所述历史对话数据和所述知识库描述信息,构建待检索数据,包括:

12.一种自动问答方法,包括:

13.一种计算设备,包括:

14.一种计算机可读存储介质,其存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现权利要求1至11任意一项或者权利要求12所述方法的步骤。

...

【技术特征摘要】

1.一种文档检索方法,包括:

2.根据权利要求1所述的方法,所述根据所述待检索数据和所述至少一个候选文档之间的关联关系,从所述至少一个候选文档中筛选出至少一个参考文档,包括:

3.根据权利要求2所述的方法,所述将所述待检索数据和所述第一候选文档输入关系确定模型,获得所述第一候选文档对应的关系指标之后,还包括:

4.根据权利要求2所述的方法,所述针对第一候选文档,将所述待检索数据和所述第一候选文档输入关系确定模型,获得所述第一候选文档对应的关系指标之后,还包括:

5.根据权利要求1所述的方法,所述根据所述至少一个参考文档对所述待检索数据进行更新,获得更新后的待检索数据,并利用所述更新后的待检索数据,从所述多个文档中检索得到目标文档之后,还包括:

6.根据权利要求1所述的方法,所述根据所述至少一个参考文档对所述待检索数据进行更新,获得更新后的待检索数据,并利用所述更新后的待检索数据,从所述多个文档中检索得到目标文档,包括:

7.根据权利要求...

【专利技术属性】
技术研发人员:关新宇余海洋李永彬黄非
申请(专利权)人:阿里云计算有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1