【技术实现步骤摘要】
一种基于多跳推理的检索方法及装置
[0001]本专利技术涉及智能检索查询领域,尤其是涉及一种基于多跳推理的检索方法 及装置。
技术介绍
[0002]开放域问答(QA)是我们利用大型文本语料库中的知识的一种重要手段, 并且可以进行多种查询而无需提前建立知识模式。使此类系统能够执行多步推 理可以进一步扩展我们探索这些语料库中知识的能力。
[0003]在最近提出的大规模QA数据集的推动下,开放域问答已经取得了很大进展。 现有技术中的一种分两个阶段的方法,即检索问题的相关内容,然后阅读信息 检索(IR)组件返回的段落以得出最终答案。此后,这种“rank和read”方法 已在各种开放域质量保证系统中采用和扩展,但是此类系统的一个前提是仅限 于回答不需要多跳的问题/多步骤推理。这是因为对于许多多跳问题,不是所有 的相关上下文都可以在单个检索步骤中获得。
技术实现思路
[0004]本专利技术主要是针对无法在单个检索步骤中获得答案的问题,提供一种基于 多跳推理的检索方法及装置。
[0005]本专利技术针对上述 ...
【技术保护点】
【技术特征摘要】 【专利技术属性】
1.一种基于多跳推理的检索方法,其特征在于,包括以下步骤:S1、给定一个问题,初始的当前推理路径仅包含问题本身;S2、使用检索器从当前推理路径中生成搜索查询,搜索查询包括新的查询词;S3、读取器将不在推理路径中的一个段落附加到当前推理路径中得到临时推理路径,然后通过搜索查询在临时推理路径中寻找问题的答案,重复此过程直至遍历所有不在当前推理路径中的段落;S4、如果步骤S3找到至少一个答案,跳转到步骤S6,如果一个答案都找不到,跳转到步骤S5;S5、重排序器根据当前推理路径对各个不在当前推理路径中的段落评分,并将排名最高的段落附加到当前推理路径形成新的当前推理路径,如果当前推理路径的总段落数达到阈值,则停止检索过程,如果未达到阈值则将更新后的当前推理路径提供给检索器,跳转到步骤S2;S6、以最高的可回答性得分预测答案。2.根据权利要求1所述的一种基于多跳推理的检索方法,其特征在于,还包括训练方法:假设系统的外部环境是一个固定的全文索引,在每一次查询检索之后,获得一个回报r
t
,t表示当前的轮次;预期回报值表达为:其中,γ∈[0,1]是折损因子,T是每次查询的轮次上限;加入一个基线:b为预设常数,Rt为加入基线后的结果;最终针对强化学习RL的损失函数为:p是概率,x
技术研发人员:赵天成,
申请(专利权)人:宏龙科技杭州有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。