问答查询方法技术

技术编号:39508413 阅读:16 留言:0更新日期:2023-11-25 18:43
本申请实施例提供问答查询方法

【技术实现步骤摘要】
问答查询方法、装置、计算设备和计算机可读存储介质


[0001]本申请实施例涉及计算机
,特别涉及一种问答查询方法

装置

计算设备和计算机可读存储介质


技术介绍

[0002]在文档检索领域,较常解决的是问答查询对应的事项,比如,当用户针对文档进行查询时,通过文档检索方法在文档中找到与查询对应的答案

[0003]在实际应用中,通过查询中的关键字,在文档中进行检索,获得查询对应的答案,但文档通常较长且包含丰富的语义信息,如此会导致得到的查询结果并不准确,比如,根据查询中的关键词
"
苹果
"
,检索结果可能既包含水果相关文档又包含手机相关文档,因此,亟需一种提高问答查询准确性的方法


技术实现思路

[0004]有鉴于此,本申请实施例提供了一种问答查询方法

本申请一个或者多个实施例同时涉及一种问答查询装置,一种计算设备,一种计算机可读存储介质以及一种计算机程序,以解决现有技术中存在的技术缺陷

[0005]根据本申请实施例的第一方面,提供了一种问答查询方法,包括:获取问答查询请求,其中,所述问答查询请求包括问题文本和目标文档;划分所述目标文档获得多个片段,其中,所述多个片段分别携带不同的视角标识,所述视角标识表征所述片段的问答视角语义;将所述问题文本和所述多个片段输入问答查询模型,获得所述目标文档中所述问题文本对应的答案文本,其中,所述问答查询模型基于多个样本对训练得到,所述样本对包括多个样本问题文本和样本文档,各样本问题文本与划分所述样本文档得到的样本片段之间视角语义关联,所述样本文档中的样本片段携带不同的视角标识

[0006]根据本申请实施例的第二方面,提供了一种问答查询装置,包括:获取模块,被配置为获取问答查询请求,其中,所述问答查询请求包括问题文本和目标文档;划分模块,被配置为划分所述目标文档获得多个片段,其中,所述多个片段分别携带不同的视角标识,所述视角标识表征所述片段的问答视角语义;获得模块,被配置为将所述问题文本和所述多个片段输入问答查询模型,获得所述目标文档中所述问题文本对应的答案文本,其中,所述问答查询模型基于多个样本对训练得到,所述样本对包括多个样本问题文本和样本文档,各样本问题文本与划分所述样本文档得到的样本片段之间视角语义关联,所述样本文档中的样本片段携带不同的视角标识

[0007]根据本申请实施例的第三方面,提供了一种计算设备,包括:存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,该计算机可执行指令被处理器执行时实现上述问答查询方法的步骤

[0008]根据本申请实施例的第四方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现上述问答查询方法的步骤

[0009]根据本申请实施例的第五方面,提供了一种计算机程序,其中,当所述计算机程序在计算机中执行时,令计算机执行上述问答查询方法的步骤

[0010]本申请一个实施例获取问答查询请求,其中,问答查询请求包括问题文本和目标文档;划分目标文档获得多个片段,其中,多个片段分别携带不同的视角标识,视角标识表征片段的问答视角语义;将问题文本和多个片段输入问答查询模型,获得目标文档中问题文本对应的答案文本,其中,问答查询模型基于多个样本对训练得到,样本对包括多个样本问题文本和样本文档,各样本问题文本与划分样本文档得到的样本片段之间视角语义关联,样本文档中的样本片段携带不同的视角标识

通过将查询请求中的目标文档进行划分,获得携带不同视角标识的片段,多个片段与视角标识建立了对应关系,使得在对问答查询模型的应用阶段,在将问题文本和多个片段输入问答查询模型进行处理的过程中,在确定问题文本和视角标识对应关系的情况下,可以通过视角标识与片段的对应关系,确定问题文本的答案文本,也即通过建立视角标识和片段的对应关系,为视角增加了可解释性,且利用视角的可解释性实现了对问答查询模型的明确语义监督训练,提高了问答查询模型输出的准确性

附图说明
[0011]图1是本申请一实施例提供的一种问答查询方法中多视图表征方法示意图;图2是目前问答查询方法应用流程图;图3是目前问答查询方法中示例性处理的示意图;图4是本申请一个实施例提供的一种问答查询方法的流程图;图5是本申请一实施例提供的问答查询方法的应用示例性示意图;图6是本申请一实施例提供的一种问答查询方法的处理过程流程图;图7是本申请一实施例提供的一种问答查询方法的模型输入示意图;图8是本申请一实施例提供的一种问答查询方法的问答查询模型训练的流程图;图9是本申请一实施例提供的一种问答查询方法的问答视角语义关系示意图;图
10
是本申请一个实施例提供的一种问答查询装置的结构示意图;图
11
是本申请一个实施例提供的一种计算设备的结构框图

具体实施方式
[0012]在下面的描述中阐述了很多具体细节以便于充分理解本申请

但是本申请能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本申请内涵的情况下做类似推广,因此本申请不受下面公开的具体实施的限制

[0013]在本申请一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请一个或多个实施例

在本申请一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其
他含义

还应当理解,本申请一个或多个实施例中使用的术语“和
/
或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合

[0014]应当理解,尽管在本申请一个或多个实施例中可能采用术语第一

第二等来描述各种信息,但这些信息不应限于这些术语

这些术语仅用来将同一类型的信息彼此区分开

例如,在不脱离本申请一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一

取决于语境,如在此所使用的词语“如果”可以被解释成为“在
……
时”或“当
……
时”或“响应于确定”。
[0015]此外,需要说明的是,本申请一个或多个实施例所涉及的用户信息(包括但不限于用户设备信息

用户个人信息等)和数据(包括但不限于用于分析的数据

存储的数据

展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,并且相关数据的收集

使用和处理需要遵守相关国家和地区的相关法律法规和标准,并提供有相应的操作本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种问答查询方法,其特征在于,包括:获取问答查询请求,其中,所述问答查询请求包括问题文本和目标文档;划分所述目标文档获得多个片段,其中,所述多个片段分别携带不同的视角标识,所述视角标识表征所述片段的问答视角语义;将所述问题文本和所述多个片段输入问答查询模型,获得所述目标文档中所述问题文本对应的答案文本,其中,所述问答查询模型基于多个样本对训练得到,所述样本对包括多个样本问题文本和样本文档,各样本问题文本与划分所述样本文档得到的样本片段之间视角语义关联,所述样本文档中的样本片段携带不同的视角标识
。2.
根据权利要求1所述的方法,其特征在于,所述划分所述目标文档获得多个片段,包括:划分所述目标文档,获得片段列表,其中,所述片段列表包括多个初始片段;在所述片段列表中的片段数量未达到预设数量的情况下,在所述片段列表中增加参考数量的空白片段,其中,所述参考数量为所述预设数量与所述片段数量的差值;基于更新的所述片段列表,获得多个片段
。3.
根据权利要求2所述的方法,其特征在于,在所述划分所述目标文档,获得片段列表之后,还包括:在所述片段数量超过所述预设数量的情况下,识别各初始片段的长度;对长度小于预设长度的两个相邻初始片段进行合并,直至所述片段列表中的片段数量达到所述预设数量;基于更新的所述片段列表,获得多个片段
。4.
根据权利要求3所述的方法,其特征在于,所述对长度小于预设长度的两个相邻初始片段进行合并,直至所述片段列表中的片段数量达到所述预设数量,包括:确定所述片段列表中长度最小的第一初始片段,并基于所述第一初始片段确定第二初始片段,其中,所述第二初始片段为所述第一初始片段相邻的两个初始片段中长度更小的;合并所述第一初始片段和所述第二初始片段,得到更新的所述片段列表;在所述片段列表中的片段数量仍超过所述预设数量的情况下,返回执行所述确定所述片段列表中长度最小的第一初始片段,并基于所述第一初始片段确定第二初始片段的步骤,直至所述片段列表中的片段数量达到所述预设数量
。5.
根据权利要求2‑4任一项所述的方法,其特征在于,所述基于更新的所述片段列表,获得多个片段,包括:针对更新的所述片段列表中的各片段,确定所述各片段的问答视角语义;基于所述各片段的问答视角语义,在所述各片段前增加相应的视角标识,获得携带视角标识的多个片段
。6.
根据权利要求1所述的方法,其特征在于,所述将所述问题文本和所述多个片段输入问答查询模型,获得所述目标文档中所述问题文本对应的答案文本,包括:将所述问题文本和所述多个片段输入问答查询模型的编码器,编码得到所述问题文本的问题向量和所述多个片段的片段向量;对所述问题向量和所述多个片段向量进行预测处理,获得所述目标文档中所述问题文本对应的答案文本

7.
根据权利要求6所述的方法,其特征在于,所述对所述问题向量和所述多个片段向量进行预测处理,获得所述目标文档中所述问题文本对应的答案文本,包括:计算所述问题向量分别和所述多个片段向量之间的相似度;确定相似度大于预设相似度的目标片段向量;将所述目标片段向量对应的目标片段确定为所述问题文本对应的答案文本
。8.
根据权利要求1所述的方法,其特征在于,在所述将所述问题文本和所述多个片段输入问答查询模型,获得所述目标文...

【专利技术属性】
技术研发人员:廖智霖陈奕名娄东方林金曙高峰
申请(专利权)人:恒生电子股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1