【技术实现步骤摘要】
问答查询方法、装置、计算设备和计算机可读存储介质
[0001]本申请实施例涉及计算机
,特别涉及一种问答查询方法
、
装置
、
计算设备和计算机可读存储介质
。
技术介绍
[0002]在文档检索领域,较常解决的是问答查询对应的事项,比如,当用户针对文档进行查询时,通过文档检索方法在文档中找到与查询对应的答案
。
[0003]在实际应用中,通过查询中的关键字,在文档中进行检索,获得查询对应的答案,但文档通常较长且包含丰富的语义信息,如此会导致得到的查询结果并不准确,比如,根据查询中的关键词
"
苹果
"
,检索结果可能既包含水果相关文档又包含手机相关文档,因此,亟需一种提高问答查询准确性的方法
。
技术实现思路
[0004]有鉴于此,本申请实施例提供了一种问答查询方法
。
本申请一个或者多个实施例同时涉及一种问答查询装置,一种计算设备,一种计算机可读存储介质以及一种计算机程序,以解决现有技术中存在的技术缺陷
。
[0005]根据本申请实施例的第一方面,提供了一种问答查询方法,包括:获取问答查询请求,其中,所述问答查询请求包括问题文本和目标文档;划分所述目标文档获得多个片段,其中,所述多个片段分别携带不同的视角标识,所述视角标识表征所述片段的问答视角语义;将所述问题文本和所述多个片段输入问答查询模型,获得所述目标文档中所述问题文本对应的答案文本,其中,所述问答查询模型基于多 ...
【技术保护点】
【技术特征摘要】
1.
一种问答查询方法,其特征在于,包括:获取问答查询请求,其中,所述问答查询请求包括问题文本和目标文档;划分所述目标文档获得多个片段,其中,所述多个片段分别携带不同的视角标识,所述视角标识表征所述片段的问答视角语义;将所述问题文本和所述多个片段输入问答查询模型,获得所述目标文档中所述问题文本对应的答案文本,其中,所述问答查询模型基于多个样本对训练得到,所述样本对包括多个样本问题文本和样本文档,各样本问题文本与划分所述样本文档得到的样本片段之间视角语义关联,所述样本文档中的样本片段携带不同的视角标识
。2.
根据权利要求1所述的方法,其特征在于,所述划分所述目标文档获得多个片段,包括:划分所述目标文档,获得片段列表,其中,所述片段列表包括多个初始片段;在所述片段列表中的片段数量未达到预设数量的情况下,在所述片段列表中增加参考数量的空白片段,其中,所述参考数量为所述预设数量与所述片段数量的差值;基于更新的所述片段列表,获得多个片段
。3.
根据权利要求2所述的方法,其特征在于,在所述划分所述目标文档,获得片段列表之后,还包括:在所述片段数量超过所述预设数量的情况下,识别各初始片段的长度;对长度小于预设长度的两个相邻初始片段进行合并,直至所述片段列表中的片段数量达到所述预设数量;基于更新的所述片段列表,获得多个片段
。4.
根据权利要求3所述的方法,其特征在于,所述对长度小于预设长度的两个相邻初始片段进行合并,直至所述片段列表中的片段数量达到所述预设数量,包括:确定所述片段列表中长度最小的第一初始片段,并基于所述第一初始片段确定第二初始片段,其中,所述第二初始片段为所述第一初始片段相邻的两个初始片段中长度更小的;合并所述第一初始片段和所述第二初始片段,得到更新的所述片段列表;在所述片段列表中的片段数量仍超过所述预设数量的情况下,返回执行所述确定所述片段列表中长度最小的第一初始片段,并基于所述第一初始片段确定第二初始片段的步骤,直至所述片段列表中的片段数量达到所述预设数量
。5.
根据权利要求2‑4任一项所述的方法,其特征在于,所述基于更新的所述片段列表,获得多个片段,包括:针对更新的所述片段列表中的各片段,确定所述各片段的问答视角语义;基于所述各片段的问答视角语义,在所述各片段前增加相应的视角标识,获得携带视角标识的多个片段
。6.
根据权利要求1所述的方法,其特征在于,所述将所述问题文本和所述多个片段输入问答查询模型,获得所述目标文档中所述问题文本对应的答案文本,包括:将所述问题文本和所述多个片段输入问答查询模型的编码器,编码得到所述问题文本的问题向量和所述多个片段的片段向量;对所述问题向量和所述多个片段向量进行预测处理,获得所述目标文档中所述问题文本对应的答案文本
。
7.
根据权利要求6所述的方法,其特征在于,所述对所述问题向量和所述多个片段向量进行预测处理,获得所述目标文档中所述问题文本对应的答案文本,包括:计算所述问题向量分别和所述多个片段向量之间的相似度;确定相似度大于预设相似度的目标片段向量;将所述目标片段向量对应的目标片段确定为所述问题文本对应的答案文本
。8.
根据权利要求1所述的方法,其特征在于,在所述将所述问题文本和所述多个片段输入问答查询模型,获得所述目标文...
【专利技术属性】
技术研发人员:廖智霖,陈奕名,娄东方,林金曙,高峰,
申请(专利权)人:恒生电子股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。