System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 文档检索方法以及自动问答方法技术_技高网

文档检索方法以及自动问答方法技术

技术编号:41210036 阅读:3 留言:0更新日期:2024-05-09 23:32
本说明书实施例提供文档检索方法以及自动问答方法,其中所述文档检索方法包括:获取待检索数据;根据待检索数据,从多个文档中检索得到至少一个候选文档;将待检索数据和至少一个候选文档输入预训练语言模型,获得检索反馈文本,其中,检索反馈文本用于描述待检索数据的检索意图和至少一个候选文档之间的偏差;根据待检索数据和检索反馈文本,从多个文档中检索得到目标文档。通过利用预训练语言模型强大的文本理解与推理能力,以自然语言的方式提供至少一个候选文档与待检索数据的检索意图之间所存在偏差的反馈,根据反馈再次检索多个文档获得目标文档,实现了完全自动化的多轮检索交互,以迭代的方式提高了目标文档与待检索数据之间的相关性。

【技术实现步骤摘要】

本说明书实施例涉及计算机,特别涉及文档检索方法以及自动问答方法


技术介绍

1、随着计算机技术的发展,自动化的文档检索(document retrieval)逐渐成为研究重点。文档检索是指在大量的文档集合中,通过用户输入的查询条件来查找并返回与之相关的信息的过程。

2、目前,由于人们对检索结果的要求越来越高,直接利用用户输入的查询条件进行文档检索,容易出现因无法准确理解实际检索意图,导致目标文档与查询条件的相关性极低,因此,亟需一种检索相关性高的文档检索方案。


技术实现思路

1、有鉴于此,本说明书实施例提供了一种文档检索方法。本说明书一个或者多个实施例同时涉及一种自动问答方法,一种文档检索装置,一种自动问答装置,一种计算设备,一种计算机可读存储介质以及一种计算机程序,以解决现有技术中存在的“因无法准确理解用户的实际检索意图,导致检索到的目标文档与查询条件的相关性极低,准确性差”的技术缺陷。

2、根据本说明书实施例的第一方面,提供了一种文档检索方法,包括:

3、获取待检索数据;

4、根据待检索数据,从多个文档中检索得到至少一个候选文档;

5、将待检索数据和至少一个候选文档输入预训练语言模型,获得检索反馈文本,其中,检索反馈文本用于描述待检索数据的检索意图和至少一个候选文档之间的偏差;

6、根据待检索数据和检索反馈文本,从多个文档中检索得到目标文档。

7、根据本说明书实施例的第二方面,提供了一种自动问答方法,包括:

8、获取待回答问题;

9、根据待回答问题,从多个文档中检索得到至少一个候选文档;

10、将待回答问题和至少一个候选文档输入预训练语言模型,获得检索反馈文本,其中,检索反馈文本用于描述待回答问题的检索意图和至少一个候选文档之间的偏差;

11、根据待回答问题和检索反馈文本,从多个文档中检索得到目标文档;

12、根据目标文档,生成待回答问题对应的答复结果。

13、根据本说明书实施例的第三方面,提供了一种文档检索装置,包括:

14、第一获取模块,被配置为获取待检索数据;

15、第一检索模块,被配置为根据待检索数据,从多个文档中检索得到至少一个候选文档;

16、第一输入模块,被配置为将待检索数据和至少一个候选文档输入预训练语言模型,获得检索反馈文本,其中,检索反馈文本用于描述待检索数据的检索意图和至少一个候选文档之间的偏差;

17、第二检索模块,被配置为根据待检索数据和检索反馈文本,从多个文档中检索得到目标文档。

18、根据本说明书实施例的第四方面,提供了一种自动问答装置,包括:

19、第二获取模块,被配置为获取待回答问题;

20、第三检索模块,被配置为根据待回答问题,从多个文档中检索得到至少一个候选文档;

21、第二输入模块,被配置为将待回答问题和至少一个候选文档输入预训练语言模型,获得检索反馈文本,其中,检索反馈文本用于描述待回答问题的检索意图和至少一个候选文档之间的偏差;

22、第四检索模块,被配置为根据待回答问题和检索反馈文本,从多个文档中检索得到目标文档;

23、生成模块,被配置为根据目标文档,生成待回答问题对应的答复结果。

24、根据本说明书实施例的第五方面,提供了一种计算设备,包括:

25、存储器和处理器;

26、所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,该计算机可执行指令被处理器执行时实现上述第一方面或者第二方面所提供方法的步骤。

27、根据本说明书实施例的第六方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现上述第一方面或者第二方面所提供方法的步骤。

28、根据本说明书实施例的第七方面,提供了一种计算机程序,其中,当所述计算机程序在计算机中执行时,令计算机执行上述第一方面或者第二方面所提供方法的步骤。

29、本说明书一个实施例提供的文档检索方法,获取待检索数据;根据待检索数据,从多个文档中检索得到至少一个候选文档;将待检索数据和至少一个候选文档输入预训练语言模型,获得检索反馈文本,其中,检索反馈文本用于描述待检索数据的检索意图和至少一个候选文档之间的偏差;根据待检索数据和检索反馈文本,从多个文档中检索得到目标文档。通过引入预训练语言模型作为至少一个候选文档的评估对象,利用其强大的文本理解与推理能力,以自然语言的方式提供至少一个候选文档所存在偏差的反馈,进一步根据检索反馈文本再次检索多个文档获得目标文档,实现了完全自动化的多轮检索交互,以迭代的方式提高了目标文档与待检索数据之间的相关性。

本文档来自技高网...

【技术保护点】

1.一种文档检索方法,包括:

2.根据权利要求1所述的方法,所述根据所述待检索数据,从多个文档中检索得到至少一个候选文档,包括:

3.根据权利要求2所述的方法,所述文档检索模型包括检索编码单元、文档编码单元和匹配单元;

4.根据权利要求1所述的方法,所述根据所述待检索数据和所述检索反馈文本,从所述多个文档中检索得到目标文档,包括:

5.根据权利要求4所述的方法,所述文档检索模型包括检索编码单元,所述检索编码单元包括第一编码子单元、第二编码子单元和融合单元;

6.根据权利要求5所述的方法,所述第二编码子单元包括第一线性层、编码层和第二线性层;

7.根据权利要求1所述的方法,所述根据所述待检索数据和所述检索反馈文本,从所述多个文档中检索得到目标文档之后,还包括:

8.根据权利要求2所述的方法,所述将所述待检索数据和所述多个文档输入文档检索模型,获得所述多个文档分别对应的匹配信息之前,还包括:

9.根据权利要求8所述的方法,所述样本集包括正样本子集、第一负样本子集和第二负样本子集;

<p>10.根据权利要求9所述的方法,所述获取正样本子集,包括:

11.根据权利要求10所述的方法,所述根据所述多个样本检索意图分别对应的正样本意图文本,构建正样本子集,包括:

12.一种自动问答方法,包括:

13.一种计算设备,包括:

14.一种计算机可读存储介质,其存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现权利要求1至11任意一项或者权利要求12所述方法的步骤。

...

【技术特征摘要】

1.一种文档检索方法,包括:

2.根据权利要求1所述的方法,所述根据所述待检索数据,从多个文档中检索得到至少一个候选文档,包括:

3.根据权利要求2所述的方法,所述文档检索模型包括检索编码单元、文档编码单元和匹配单元;

4.根据权利要求1所述的方法,所述根据所述待检索数据和所述检索反馈文本,从所述多个文档中检索得到目标文档,包括:

5.根据权利要求4所述的方法,所述文档检索模型包括检索编码单元,所述检索编码单元包括第一编码子单元、第二编码子单元和融合单元;

6.根据权利要求5所述的方法,所述第二编码子单元包括第一线性层、编码层和第二线性层;

7.根据权利要求1所述的方法,所述根据所述待检索数据和所述检索反馈文本,从所述多个文档中检索得...

【专利技术属性】
技术研发人员:潘凯航李俊成宋红叶费豪吉炜张硕林君刘晓钟汤斯亮
申请(专利权)人:浙江阿里巴巴机器人有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1