问题检索模型的训练方法及装置、问题检索方法及装置制造方法及图纸

技术编号:32183962 阅读:9 留言:0更新日期:2022-02-08 15:47
本申请提供一种问题检索模型的训练方法及装置、问题检索方法及装置,其中所述问题检索模型的训练方法包括:获取样本问题答案对,并将样本问题答案对存储至预设检索数据库;根据获得的第一样本问题,从预设检索数据库中获取关联的第一参考样本问题;根据第一样本问题和第一参考样本问题,构造第一训练样本;根据第一训练样本,对问题检索模型进行训练,并返回执行根据获得的第一样本问题,从预设检索数据库中获取关联的第一参考样本问题的操作步骤,直至达到训练停止条件。如此,第一训练样本的样本内容更丰富全面,从而可以提高问题检索模型的训练速度,并提高训练得到的问题检索模型对输入问题进行分析的准确性。型对输入问题进行分析的准确性。型对输入问题进行分析的准确性。

【技术实现步骤摘要】
问题检索模型的训练方法及装置、问题检索方法及装置


[0001]本申请涉及计算机
,特别涉及一种问题检索模型的训练方法及装置、问题检索方法及装置、计算设备和计算机可读存储介质。

技术介绍

[0002]人工智能(artificial intelligence;AI)是指以工程化(即设计并制造)的系统感知环境的能力,以及获取、处理、应用和表示知识的能力。随着计算机和人工智能技术的快速发展,根据用户提出的问题,自动搜索答案的功能也日益完善,应用到了电商平台的智能客服、搜索引擎的自动问答服务等多个应用场景中。
[0003]现有技术中,往往是预先搜集大量的问题和答案,将其存储在预设的答案数据库中,当用户提出问题后,计算用户提出的问题与预设的答案数据库中的各个问题之间的字符重复度,根据该字符重复度,筛选出与用户提出的问题相似的问题,从而确定用户提出的问题对应的答案。
[0004]然而,上述根据用户提出的问题搜索答案的方案中,是根据问题的字符重复度筛选相似的问题,而实际上问题中的字符还可能存在有上下文关系,并不是完全无关的独立特征,因此可能导致确定出的相似问题准确性较低,进而导致搜索答案的准确性较低。

技术实现思路

[0005]有鉴于此,本申请实施例提供了一种问题检索模型的训练方法及装置、问题检索方法及装置、计算设备和计算机可读存储介质,以解决现有技术中存在的技术缺陷。
[0006]根据本申请实施例的第一方面,提供了一种问题检索模型的训练方法,包括:
[0007]获取样本问题答案对,并将所述样本问题答案对存储至预设检索数据库;
[0008]根据获得的第一样本问题,从所述预设检索数据库中获取关联的第一参考样本问题;
[0009]根据所述第一样本问题和所述第一参考样本问题,构造第一训练样本;
[0010]根据所述第一训练样本,对所述问题检索模型进行训练,并返回执行所述根据获得的第一样本问题,从所述预设检索数据库中获取关联的第一参考样本问题的操作步骤,直至达到训练停止条件。
[0011]根据本申请实施例的第二方面,提供了一种问题检索方法,包括:
[0012]根据获得的搜索问题,从预设检索数据库中获取关联的第一候选问题;
[0013]根据问题检索模型和预设问题向量,获取所述搜索问题关联的第二候选问题,其中,所述问题检索模型基于上述第一方面任一项所述的方法训练得到;
[0014]合并所述第一候选问题和所述第二候选问题,得到所述搜索问题对应的候选问题集;
[0015]根据所述候选问题集,利用相似度分析模型,确定所述搜索问题对应的目标相似问题。
[0016]根据本申请实施例的第三方面,提供了一种问题检索模型的训练装置,包括:
[0017]第一获取模块,被配置为获取样本问题答案对,并将所述样本问题答案对存储至预设检索数据库;
[0018]第二获取模块,被配置为根据获得的第一样本问题,从所述预设检索数据库中获取关联的第一参考样本问题;
[0019]构造模块,被配置为根据所述第一样本问题和所述第一参考样本问题,构造第一训练样本;
[0020]第一训练模块,被配置为根据所述第一训练样本,对所述问题检索模型进行训练,并返回执行所述根据获得的第一样本问题,从所述预设检索数据库中获取关联的第一参考样本问题的操作步骤,直至达到训练停止条件。
[0021]根据本申请实施例的第四方面,提供了一种问题检索装置,包括:
[0022]第三获取模块,被配置为根据获得的搜索问题,从预设检索数据库中获取关联的第一候选问题;
[0023]第四获取模块,被配置为根据问题检索模型和预设问题向量,获取所述搜索问题关联的第二候选问题,其中,所述问题检索模型基于上述权利要求1

6任一项所述的方法训练得到;
[0024]合并模块,被配置为合并所述第一候选问题和所述第二候选问题,得到所述搜索问题对应的候选问题集;
[0025]确定模块,被配置为根据所述候选问题集,利用相似度分析模型,确定所述搜索问题对应的目标相似问题。
[0026]根据本申请实施例的第五方面,提供了一种计算设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令,所述处理器执行所述指令时实现所述问题检索模型的训练方法或者问题检索方法的步骤。
[0027]根据本申请实施例的第六方面,提供了一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时实现所述问题检索模型的训练方法或者问题检索方法的步骤。
[0028]根据本申请实施例的第七五方面,提供了一种芯片,其存储有计算机指令,该指令被芯片执行时实现所述问题检索模型的训练方法或者问题检索方法的步骤。
[0029]本申请实施例中可以通过第一样本问题,以及与第一样本问题关联的第一参考样本问题共同构造得到第一训练样本,然后通过第一训练样本对问题检索模型进行训练,如此,第一训练样本的样本内容更丰富全面,从而可以提高问题检索模型的训练速度,并提高训练得到的问题检索模型对输入问题进行分析的准确性。
[0030]本申请实施例中可以先通过预设检索数据库筛选与搜索问题相似的第一候选问题,然后再利用训练好的问题检索模型获得与搜索问题相似的第二候选问题,合并筛选出的第一候选问题和第二候选问题,得到候选问题集,然后再利用相似度分析模型,从候选问题集中筛选出与搜索问题真正相似的目标相似问题。如此,不单单利用问题内容的相似度对问题进行筛选,而是通过两种不同方式的双重筛选,得到候选问题集,避免漏掉实际上真正与搜索问题相似的问题,然后再从候选问题集中筛选出真正与搜索问题相似的问题,从而提高确定与搜索问题相似的问题的准确性,进而提高后续搜索答案的准确性。
附图说明
[0031]图1是本申请一实施例提供的计算设备的结构框图;
[0032]图2是本申请一实施例提供的问题检索模型的训练方法的流程图;
[0033]图3是本申请一实施例提供的问题检索方法的流程图;
[0034]图4是本申请一实施例提供的问题检索模型的训练装置的结构示意图;
[0035]图5是本申请一实施例提供的问题检索装置的结构示意图;
[0036]图6是本申请一实施例提供的一种预设检索数据库的结构示意图;
[0037]图7是本申请一实施例提供的一种问题检索模型的结构示意图;
[0038]图8是本申请一实施例提供的一种相似度分析模型的结构示意图。
具体实施方式
[0039]在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本申请内涵的情况下做类似推广,因此本申请不受下面公开的具体实施的限制。
[0040]在本申请一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请一个或多个实施例。在本申请一个或多个实施例和所附权利本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种问题检索模型的训练方法,其特征在于,包括:获取样本问题答案对,并将所述样本问题答案对存储至预设检索数据库;根据获得的第一样本问题,从所述预设检索数据库中获取关联的第一参考样本问题;根据所述第一样本问题和所述第一参考样本问题,构造第一训练样本;根据所述第一训练样本,对所述问题检索模型进行训练,并返回执行所述根据获得的第一样本问题,从所述预设检索数据库中获取关联的第一参考样本问题的操作步骤,直至达到训练停止条件。2.根据权利要求1所述的问题检索模型的训练方法,其特征在于,根据获得的第一样本问题,从所述预设检索数据库中获取关联的第一参考样本问题,包括:确定所述第一样本问题和第二样本问题之间的第一相似度,其中,所述第二样本问题为所述预设检索数据库中包括的样本问题答案对中的问题;将所述第一相似度大于第一相似度阈值的第二样本问题,确定为所述第一样本问题对应的第一参考样本问题。3.根据权利要求2所述的问题检索模型的训练方法,其特征在于,所述第一参考样本问题携带与所述第一样本问题的第一相似度;根据所述第一样本问题和所述第一参考样本问题,构造第一训练样本,包括:根据所述第一相似度,将所述第一参考样本问题按预设排列规则进行排列;将排列后的第一参考样本问题按序排在所述第一样本问题之后,得到所述第一训练样本;根据所述预设排列规则,确定相似样本问题在所述第一训练样本中所处的位置,所述相似样本问题为与所述第一样本问题的第一相似度最高的样本问题;将所述位置作为所述第一训练样本的第一样本位置标签。4.根据权利要求1所述的问题检索模型的训练方法,其特征在于,根据所述第一样本问题和所述第一参考样本问题,构造第一训练样本,包括:确定所述第一参考样本问题中包括的相似样本问题,所述相似样本问题为标注与所述第一样本问题相似的样本问题;将所述第一样本问题和所述第一参考样本问题组成所述第一训练样本,并设置所述第一训练样本的第一样本位置标签为所述相似样本问题在所述第一训练样本中所处的位置。5.根据权利要求3或4所述的问题检索模型的训练方法,其特征在于,根据所述第一训练样本,对所述问题检索模型进行训练,包括:将所述第一训练样本输入所述问题检索模型中,得到所述第一训练样本对应的第一预测位置标签;基于所述第一样本位置标签和所述第一预测位置标签确定所述问题检索模型的损失值;基于所述损失值调整所述问题检索模型的参数,对所述问题检索模型进行训练。6.一种问题检索方法,其特征在于,包括:根据获得的搜索问题,从预设检索数据库中获取关联的第一候选问题;根据问题检索模型和预设问题向量,获取所述搜索问题关联的第二候选问题,其中,所述问题检索模型基于上述权利要求1

5任一项所述的方法训练得到;
合并所述第一候选问题和所述第二候选问题,得到所述搜索问题对应的候选问题集;根据所述候选问题集,利用相似度分析模型,确定所述搜索问题对应的目标相似问题。7.根据权利要求6所述的问题检索方法,其特征在于,根据获得的搜索问题,从预设检索数据库中获取关联的第一候选问题,包括:确定所述搜索问题和预设问题之间的第二相似度,其中,所述预设问题为所述预设检索数据库中包括的预设问题答案对中的问题;将所述第二相似度大于第二相似度阈值的预设问题,确定为所述搜索问题关联的第一候选问题。8.根据权利要求7所述的问题检索方法,其特征在于,根据问题检索模型和预设问题向量,获取所述搜索问题关联的第二候选问题之前,还包括:将所述预设问题输入所述问题检索模型,通过所述问题检索模型的特征提取层获取所述预设问题对应的预设问题向量;相应地,根据问题检索模型和预设问题向量,获取所述搜索问题关联的第二候选问题,包括:将所述搜索问题输入所述问题检索模型,通过所述问题检索模型的特征提取层获取所述搜索问题对应的搜索问题向量;确定所述搜索问题向量和所述预设问题向量之间的第三相似度,并确定所述第三相似度大于第三相似度阈值的目标问题向量;将所述目标问题向量对应的预设问题确定为所述搜索问题关联的第二候选问题。9.根据权...

【专利技术属性】
技术研发人员:王丙琛李长亮
申请(专利权)人:北京金山数字娱乐科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1