一种基于多跳推理的检索方法及装置制造方法及图纸

技术编号：31583708 阅读：35 留言：0更新日期：2021-12-25 11:28

本发明专利技术公开了一种基于多跳推理的检索方法及装置，方法包括：S1、给定一个问题作为初始的当前推理路径；S2、使用检索器从当前推理路径中生成搜索查询；S3、读取器逐次将不在推理路径中的一个段落附加到当前推理路径中得到临时推理路径，然后在临时推理路径中寻找问题的答案；S4、如果找到至少一个答案，跳转到S6，否则跳转到S5；S5、重排序器对段落评分，并将排名最高的段落附加到当前推理路径，如果当前推理路径的总段落数未达到阈值则跳转到S2；S6、以最高的可回答性得分预测答案。本方案可以在不依赖人工标注推理路径的场景下，利用深度强化学习，针对任意文本知识库自动寻找最佳的推理路线。理路线。理路线。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于多跳推理的检索方法及装置

[0001]本专利技术涉及智能检索查询领域，尤其是涉及一种基于多跳推理的检索方法及装置。

技术介绍

[0002]开放域问答(QA)是我们利用大型文本语料库中的知识的一种重要手段，并且可以进行多种查询而无需提前建立知识模式。使此类系统能够执行多步推理可以进一步扩展我们探索这些语料库中知识的能力。
[0003]在最近提出的大规模QA数据集的推动下，开放域问答已经取得了很大进展。现有技术中的一种分两个阶段的方法，即检索问题的相关内容，然后阅读信息检索(IR)组件返回的段落以得出最终答案。此后，这种“rank和read”方法已在各种开放域质量保证系统中采用和扩展，但是此类系统的一个前提是仅限于回答不需要多跳的问题/多步骤推理。这是因为对于许多多跳问题，不是所有的相关上下文都可以在单个检索步骤中获得。

技术实现思路

[0004]本专利技术主要是针对无法在单个检索步骤中获得答案的问题，提供一种基于多跳推理的检索方法及装置。
[0005]本专利技术针对上述...

【技术保护点】

【技术特征摘要】
1.一种基于多跳推理的检索方法，其特征在于，包括以下步骤：S1、给定一个问题，初始的当前推理路径仅包含问题本身；S2、使用检索器从当前推理路径中生成搜索查询，搜索查询包括新的查询词；S3、读取器将不在推理路径中的一个段落附加到当前推理路径中得到临时推理路径，然后通过搜索查询在临时推理路径中寻找问题的答案，重复此过程直至遍历所有不在当前推理路径中的段落；S4、如果步骤S3找到至少一个答案，跳转到步骤S6，如果一个答案都找不到，跳转到步骤S5；S5、重排序器根据当前推理路径对各个不在当前推理路径中的段落评分，并将排名最高的段落附加到当前推理路径形成新的当前推理路径，如果当前推理路径的总段落数达到阈值，则停止检索过程，如果未达到阈值则将更新后的当前推理路径提供给检索器，跳转到步骤S2；S6、以最高的可回答性得分预测答案。2.根据权利要求1所述的一种基于多跳推理的检索方法，其特征在于，还包括训练方法：假设系统的外部环境是一个固定的全文索引，在每一次查询检索之后，获得一个回报r
t
，t表示当前的轮次；预期回报值表达为：其中，γ∈[0,1]是折损因子，T是每次查询的轮次上限；加入一个基线：b为预设常数，Rt为加入基线后的结果；最终针对强化学习RL的损失函数为：p是概率，x

【专利技术属性】
技术研发人员：赵天成，
申请(专利权)人：宏龙科技杭州有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人