召回模型训练方法、数据搜索方法及相关装置和程序产品制造方法及图纸

技术编号：40273004 阅读：12 留言：0更新日期：2024-02-02 22:59

本公开提供了召回模型训练方法、数据搜索方法及相关装置和程序产品，涉及深度学习、模型训练、数据搜索等人工智能技术领域。该方法包括：对真实业务语料的语料内容进行随机掩码处理，并利用得到的掩码后语料和对应的真实业务语料构建正样本，且通过随机负采样得到第一负样本；利用基于正样本和第一负样本构建出的第一训练样本，对初始召回模型进行训练，并对训练中召回模型执行多轮次的加强训练操作：将当前轮次下的训练中召回模型对测试语料返回的召回结果序列中位于最后一个正确结果后的、前预设数量的错误结果，确定为当前轮次下的第二负样本；利用基于第一训练样本和第二负样本构建出的第二训练样本，对训练中召回模型进行加强训练。

全部详细技术资料下载

【技术实现步骤摘要】

本公开涉及数据处理，具体涉及深度学习、模型训练、数据搜索等人工智能，尤其涉及一种召回模型训练方法和数据搜索方法，以及对应的装置、电子设备、计算机可读存储介质及计算机程序产品。

技术介绍

1、企业和政府单位中因经年累月会存积有大量的结构化数据，在后续使用过程中，往往希望能够借助搜索引擎方便快捷地实现精准查找，从而提升业务效率和质量。

2、搜索过程通常可以拆分为先召回再排序这两个阶段，如何提升召回结果的准确性进而通过后续排序会用户搜索问题返回数量合适、相关性较好的准确结果，是本领域技术人员亟待解决的问题。

技术实现思路

1、本公开实施例提出了一种召回模型训练方法、数据搜索方法，以及对应配套的装置、电子设备、计算机可读存储介质及计算机程序产品。

2、第一方面，本公开实施例提出了一种召回模型训练方法，包括：通过对真实业务语料的语料内容进行随机掩码处理，得到掩码后语料；利用掩码后语料和对应的真实业务语料构建正样本，并通过对真实业务语料进行随机负采样得到第一负样本；利用基于正样本和第一负样本构建出的第一训练样本，对初始召回模型进行训练，得到训练中召回模型；对训练中召回模型重复执行多轮次的预设加强训练操作，直至将满足预设训练目标的训练中召回模型输出为目标召回模型：将当前轮次下的训练中召回模型对测试语料返回的召回结果序列中位于最后一个正确结果后的、前预设数量的错误召回结果，确定为当前轮次下的第二负样本；利用基于第一训练样本和当前轮次下的第二负样本构建出的当前轮次下的第二训练

3、第二方面，本公开实施例提出了一种召回模型训练装置，包括：随机掩码处理单元，被配置成通过对真实业务语料的语料内容进行随机掩码处理，得到掩码后语料；正样本及第一负样本构建单元，被配置成利用掩码后语料和对应的真实业务语料构建正样本，并通过对真实业务语料进行随机负采样得到第一负样本；简单训练单元，被配置成利用基于正样本和第一负样本构建出的第一训练样本，对初始召回模型进行训练，得到训练中召回模型；加强训练单元，被配置成对训练中召回模型重复执行多轮次的预设加强训练操作，直至将满足预设训练目标的训练中召回模型输出为目标召回模型：将当前轮次下的训练中召回模型对测试语料返回的召回结果序列中位于最后一个正确结果后的、前预设数量的错误召回结果，确定为当前轮次下的第二负样本；利用基于第一训练样本和当前轮次下的第二负样本构建出的当前轮次下的第二训练样本，对当前轮次下的训练中召回模型进行加强训练。

4、第三方面，本公开实施例提出了一种数据搜索方法，包括：获取输入的待搜索问题；将待搜索问题输入预设的目标召回模型，得到输出的召回结果序列；其中，目标召回模型根据第一方面描述的召回模型训练方法得到；对召回结果序列进行排序处理，并将经排序处理后的召回结果作为与待搜索问题对应的搜索结果。

5、第四方面，本公开实施例提出了一种数据搜索装置，包括：待搜索问题获取单元，被配置成获取输入的待搜索问题；结果召回单元，被配置成将待搜索问题输入预设的目标召回模型，得到输出的召回结果序列；其中，目标召回模型根据如第二方面描述的召回模型训练装置得到；排序单元，被配置成对召回结果序列进行排序处理，并将经排序处理后的召回结果作为与待搜索问题对应的搜索结果。

6、第五方面，本公开实施例提供了一种电子设备，该电子设备包括：至少一个处理器；以及与至少一个处理器通信连接的存储器；其中，存储器存储有可被至少一个处理器执行的指令，该指令被至少一个处理器执行，以使至少一个处理器执行时能够实现如第一方面描述的召回模型训练方法或如第三方面描述的数据搜索方法。

7、第六方面，本公开实施例提供了一种存储有计算机指令的非瞬时计算机可读存储介质，该计算机指令用于使计算机执行时能够实现如第一方面描述的召回模型训练方法或如第三方面描述的数据搜索方法。

8、第七方面，本公开实施例提供了一种包括计算机程序的计算机程序产品，该计算机程序在被处理器执行时能够实现如第一方面描述的召回模型训练方法的步骤或如第三方面描述的数据搜索方法的步骤。

9、本公开实施例提供的召回模型训练方案，首先通过对真实业务语料进行随机掩码的方式得到掩码后语料，以便基于掩码后语料和真实业务语料在无需标注的情况构建适用自监督训练方式的训练样本，其次又通过先使用较简单的第一负样本与正样本构建出的第一训练样本对初始召回模型进行第一阶段的简单训练，以使得到的训练中召回模型能够区分正确结果与明显的错误结果，接着又通过将训练中召回模型输出的召回结果序列中位于最后一个正确结果后的、前预设数量的错误结果选取为较难的第二负样本，并使用其与第一训练样本共同构建得到第二训练样本对训练中召回模型进行第二阶段的加强训练，以进一步提升召回模型对正确结果和疑似的错误结果的区分能力，使最终得到的目标召回模型所召回的多个结果排序更合理、错误结果更少。

10、本公开实施例提供的数据搜索方案，在获取用户输入的待搜索问题后，首先借助经上述召回模型训练方案训练得到的目标召回模型召回与待该待搜索问题对应的召回结果序列，即借助该目标召回模型的能力得到各准确且排序合理的召回结果，接着通过对召回结果序列进行重新排序，以得到最终可用于向用户呈现的搜索结果序列，提升了搜索结果序列中各搜索结果的准确性和减少了错误答案的数量。

11、应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

本文档来自技高网...

【技术保护点】

1.一种召回模型训练方法，包括：

2.根据权利要求1所述的方法，其中，所述通过对真实业务语料的语料内容进行随机掩码处理，得到掩码后语料，包括：

3.根据权利要求1所述的方法，其中，所述真实业务语料包括由真实业务场景下的结构化数据构成的语料。

4.根据权利要求1所述的方法，其中，所述预设训练目标被满足的条件包括以下至少一项：

5.根据权利要求1所述的方法，其中，所述前预设数量的大小随训练轮次数的增加逐渐变小。

6.根据权利要求1所述的方法，其中，所述初始召回模型包括基于语义的、采用双塔Pair-Wise结构的语义召回模型，采用间隔排名损失Margin Rank Loss作为损失函数。

7.根据权利要求1所述的方法，还包括：

8.根据权利要求1-7任一项所述的方法，还包括：

9.根据权利要求8所述的方法，其中，所述过滤模型包括采用单塔Point-Wise结构的深度学习模型，采用用于刻画正样本的Dice Loss作为损失函数。

10.一种数据搜索方法，包括：

11.根

12.一种召回模型训练装置，包括：

13.根据权利要求12所述的装置，其中，所述随机掩码处理单元被进一步配置成：

14.根据权利要求12所述的装置，其中，所述真实业务语料包括由真实业务场景下的结构化数据构成的语料。

15.根据权利要求12所述的装置，其中，所述预设训练目标被满足的条件包括以下至少一项：

16.根据权利要求12所述的装置，其中，所述前预设数量的大小随训练轮次数的增加逐渐变小。

17.根据权利要求12所述的装置，其中，所述初始召回模型包括基于语义的、采用双塔Pair-Wise结构的语义召回模型，采用间隔排名损失Margin Rank Loss作为损失函数。

18.根据权利要求12所述的装置，还包括：

19.根据权利要求12-18任一项所述的装置，还包括：

20.根据权利要求19所述的装置，其中，所述过滤模型包括采用单塔Point-Wise结构的深度学习模型，采用用于刻画正样本的Dice Loss作为损失函数。

21.一种数据搜索装置，包括：

22.根据权利要求21所述的装置，其中，所述排序单元包括被配置成对所述召回结果序列进行排序处理的排序处理子单元，所述排序处理子单元被进一步配置成：

23.一种电子设备，包括：

24.一种存储有计算机指令的非瞬时计算机可读存储介质，所述计算机指令用于使所述计算机执行权利要求1-9中任一项所述的召回模型训练方法和/或权利要求10-11中任一项所述的数据搜索方法。

25.一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现根据权利要求1-9中任一项所述召回模型训练方法的步骤和/或权利要求10-11中任一项所述数据搜索方法的步骤。

...

【技术特征摘要】

1.一种召回模型训练方法，包括：

2.根据权利要求1所述的方法，其中，所述通过对真实业务语料的语料内容进行随机掩码处理，得到掩码后语料，包括：

3.根据权利要求1所述的方法，其中，所述真实业务语料包括由真实业务场景下的结构化数据构成的语料。

4.根据权利要求1所述的方法，其中，所述预设训练目标被满足的条件包括以下至少一项：

5.根据权利要求1所述的方法，其中，所述前预设数量的大小随训练轮次数的增加逐渐变小。

6.根据权利要求1所述的方法，其中，所述初始召回模型包括基于语义的、采用双塔pair-wise结构的语义召回模型，采用间隔排名损失margin rank loss作为损失函数。

7.根据权利要求1所述的方法，还包括：

8.根据权利要求1-7任一项所述的方法，还包括：

9.根据权利要求8所述的方法，其中，所述过滤模型包括采用单塔point-wise结构的深度学习模型，采用用于刻画正样本的dice loss作为损失函数。

10.一种数据搜索方法，包括：

11.根据权利要求10所述的方法，其中，所述对所述召回结果序列进行排序处理，包括：

12.一种召回模型训练装置，包括：

13.根据权利要求12所述的装置，其中，所述随机掩码处理单元被进一步配置成：

14.根据权利要求12所述的装置，其中，所述真实业务语料包括由真实业务场景下的结构化数据构成的语料。

【专利技术属性】
技术研发人员：甘露，张新运，张建兵，陈亮辉，孙珂，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人