问题检索模型的训练方法及装置、问题检索方法及装置制造方法及图纸

技术编号：32183962 阅读：9 留言：0更新日期：2022-02-08 15:47

本申请提供一种问题检索模型的训练方法及装置、问题检索方法及装置，其中所述问题检索模型的训练方法包括：获取样本问题答案对，并将样本问题答案对存储至预设检索数据库；根据获得的第一样本问题，从预设检索数据库中获取关联的第一参考样本问题；根据第一样本问题和第一参考样本问题，构造第一训练样本；根据第一训练样本，对问题检索模型进行训练，并返回执行根据获得的第一样本问题，从预设检索数据库中获取关联的第一参考样本问题的操作步骤，直至达到训练停止条件。如此，第一训练样本的样本内容更丰富全面，从而可以提高问题检索模型的训练速度，并提高训练得到的问题检索模型对输入问题进行分析的准确性。型对输入问题进行分析的准确性。型对输入问题进行分析的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
问题检索模型的训练方法及装置、问题检索方法及装置

[0001]本申请涉及计算机
，特别涉及一种问题检索模型的训练方法及装置、问题检索方法及装置、计算设备和计算机可读存储介质。

技术介绍

[0002]人工智能(artificial intelligence；AI)是指以工程化(即设计并制造)的系统感知环境的能力，以及获取、处理、应用和表示知识的能力。随着计算机和人工智能技术的快速发展，根据用户提出的问题，自动搜索答案的功能也日益完善，应用到了电商平台的智能客服、搜索引擎的自动问答服务等多个应用场景中。
[0003]现有技术中，往往是预先搜集大量的问题和答案，将其存储在预设的答案数据库中，当用户提出问题后，计算用户提出的问题与预设的答案数据库中的各个问题之间的字符重复度，根据该字符重复度，筛选出与用户提出的问题相似的问题，从而确定用户提出的问题对应的答案。
[0004]然而，上述根据用户提出的问题搜索答案的方案中，是根据问题的字符重复度筛选相似的问题，而实际上问题中的字符还可能存在有上下文关系，并不是完全无关的独立特征，因此可能导致确定出的相似问题准确性较低，进而导致搜索答案的准确性较低。

技术实现思路

[0005]有鉴于此，本申请实施例提供了一种问题检索模型的训练方法及装置、问题检索方法及装置、计算设备和计算机可读存储介质，以解决现有技术中存在的技术缺陷。
[0006]根据本申请实施例的第一方面，提供了一种问题检索模型的训练方法，包括：
[0007]获取样本问题答案...

【技术保护点】

【技术特征摘要】
1.一种问题检索模型的训练方法，其特征在于，包括：获取样本问题答案对，并将所述样本问题答案对存储至预设检索数据库；根据获得的第一样本问题，从所述预设检索数据库中获取关联的第一参考样本问题；根据所述第一样本问题和所述第一参考样本问题，构造第一训练样本；根据所述第一训练样本，对所述问题检索模型进行训练，并返回执行所述根据获得的第一样本问题，从所述预设检索数据库中获取关联的第一参考样本问题的操作步骤，直至达到训练停止条件。2.根据权利要求1所述的问题检索模型的训练方法，其特征在于，根据获得的第一样本问题，从所述预设检索数据库中获取关联的第一参考样本问题，包括：确定所述第一样本问题和第二样本问题之间的第一相似度，其中，所述第二样本问题为所述预设检索数据库中包括的样本问题答案对中的问题；将所述第一相似度大于第一相似度阈值的第二样本问题，确定为所述第一样本问题对应的第一参考样本问题。3.根据权利要求2所述的问题检索模型的训练方法，其特征在于，所述第一参考样本问题携带与所述第一样本问题的第一相似度；根据所述第一样本问题和所述第一参考样本问题，构造第一训练样本，包括：根据所述第一相似度，将所述第一参考样本问题按预设排列规则进行排列；将排列后的第一参考样本问题按序排在所述第一样本问题之后，得到所述第一训练样本；根据所述预设排列规则，确定相似样本问题在所述第一训练样本中所处的位置，所述相似样本问题为与所述第一样本问题的第一相似度最高的样本问题；将所述位置作为所述第一训练样本的第一样本位置标签。4.根据权利要求1所述的问题检索模型的训练方法，其特征在于，根据所述第一样本问题和所述第一参考样本问题，构造第一训练样本，包括：确定所述第一参考样本问题中包括的相似样本问题，所述相似样本问题为标注与所述第一样本问题相似的样本问题；将所述第一样本问题和所述第一参考样本问题组成所述第一训练样本，并设置所述第一训练样本的第一样本位置标签为所述相似样本问题在所述第一训练样本中所处的位置。5.根据权利要求3或4所述的问题检索模型的训练方法，其特征在于，根据所述第一训练样本，对所述问题检索模型进行训练，包括：将所述第一训练样本输入所述问题检索模型中，得到所述第一训练样本对应的第一预测位置标签；基于所述第一样本位置标签和所述第一预测位置标签确定所述问题检索模型的损失值；基于所述损失值调整所述问题检索模型的参数，对所述问题检索模型进行训练。6.一种问题检索方法，其特征在于，包括：根据获得的搜索问题，从预设检索数据库中获取关联的第一候选问题；根据问题检索模型和预设问题向量，获取所述搜索问题关联的第二候选问题，其中，所述问题检索模型基于上述权利要求1
‑
5任一项所述的方法训练得到；
合并所述第一候选问题和所述第二候选问题，得到所述搜索问题对应的候选问题集；根据所述候选问题集，利用相似度分析模型，确定所述搜索问题对应的目标相似问题。7.根据权利要求6所述的问题检索方法，其特征在于，根据获得的搜索问题，从预设检索数据库中获取关联的第一候选问题，包括：确定所述搜索问题和预设问题之间的第二相似度，其中，所述预设问题为所述预设检索数据库中包括的预设问题答案对中的问题；将所述第二相似度大于第二相似度阈值的预设问题，确定为所述搜索问题关联的第一候选问题。8.根据权利要求7所述的问题检索方法，其特征在于，根据问题检索模型和预设问题向量，获取所述搜索问题关联的第二候选问题之前，还包括：将所述预设问题输入所述问题检索模型，通过所述问题检索模型的特征提取层获取所述预设问题对应的预设问题向量；相应地，根据问题检索模型和预设问题向量，获取所述搜索问题关联的第二候选问题，包括：将所述搜索问题输入所述问题检索模型，通过所述问题检索模型的特征提取层获取所述搜索问题对应的搜索问题向量；确定所述搜索问题向量和所述预设问题向量之间的第三相似度，并确定所述第三相似度大于第三相似度阈值的目标问题向量；将所述目标问题向量对应的预设问题确定为所述搜索问题关联的第二候选问题。9.根据权...

【专利技术属性】
技术研发人员：王丙琛，李长亮，
申请(专利权)人：北京金山数字娱乐科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人