样本生成方法、模型的训练方法以及检索方法技术

技术编号:33961666 阅读:49 留言:0更新日期:2022-06-30 00:39
本公开提供了一种样本生成方法、语言处理模型的训练方法、检索方法、装置、电子设备、存储介质以及程序产品,涉及人工智能技术领域,尤其涉及深度学习技术领域。具体实现方案为:从语料集合中确定与待匹配语句相匹配的第一目标语句,将待匹配语句和第一目标语句,作为负样本语句对;从日志中获取搜索语句和与搜索语句相匹配的第二目标语句,将搜索语句和第二目标语句,作为正样本语句对;以及基于负样本语句对和正样本语句对,生成目标样本,负样本语句对之间的语义相关性大于第一预定阈值、且小于第二预定阈值,正样本语句对的语义相关性大于第二预定阈值。大于第二预定阈值。大于第二预定阈值。

【技术实现步骤摘要】
样本生成方法、模型的训练方法以及检索方法


[0001]本公开涉及人工智能
,尤其涉及深度学习
,具体涉及样本生成方法、语言处理模型的训练方法、检索方法、装置、电子设备、存储介质以及程序产品。

技术介绍

[0002]随着人工智能技术的不断发展,自然语言处理实现让机器能够听懂人类输出的自然语言,理解自然语言中的内在含义,并作出相应的反馈。在这些操作中,语义的准确理解、反馈的迅速程度、以及给予相应的意见或者建议,均成为影响人机交互顺畅的因素。

技术实现思路

[0003]本公开提供了一种样本生成方法、语言处理模型的训练方法、检索方法、装置、电子设备、存储介质以及程序产品。
[0004]根据本公开的一方面,提供了一种样本生成方法,包括:从语料集合中确定与待匹配语句相匹配的第一目标语句,将所述待匹配语句和所述第一目标语句,作为负样本语句对;从日志中获取搜索语句和与所述搜索语句相匹配的第二目标语句,将所述搜索语句和所述第二目标语句,作为正样本语句对;以及基于所述负样本语句对和所述正样本语句对,生成目标样本,其中,所述负样本语句对之间的语义相关性大于第一预定阈值、且小于第二预定阈值,所述正样本语句对的语义相关性大于所述第二预定阈值。
[0005]根据本公开的另一方面,提供了一种语言处理模型的训练方法,包括:利用训练样本训练语言处理模型,得到经训练的语言处理模型,其中,所述训练样本是利用本公开所述的样本生成方法生成的。
[0006]根据本公开的另一方面,提供了一种检索方法,包括:获取检索项;以及将所述检索项和多个候选语句输入至语言处理模型中,得到目标语句,其中,所述语言处理模型是利用本公开所述的语言处理模型的训练方法训练得到的。
[0007]根据本公开的另一方面,提供了一种样本生成装置,包括:第一确定模块,用于从语料集合中确定与待匹配语句相匹配的第一目标语句,将所述待匹配语句和所述第一目标语句,作为负样本语句对;第二确定模块,用于从日志中获取搜索语句和与所述搜索语句相匹配的第二目标语句,将所述搜索语句和所述第二目标语句,作为正样本语句对;以及生成模块,用于基于所述负样本语句对和所述正样本语句对,生成目标样本,其中,所述负样本语句对之间的语义相关性大于第一预定阈值、且小于第二预定阈值,所述正样本语句对的语义相关性大于所述第二预定阈值。
[0008]根据本公开的另一方面,提供了一种语言处理模型的训练装置,包括:训练模块,用于利用训练样本训练语言处理模型,得到经训练的语言处理模型,其中,所述训练样本是利用本公开所述的样本生成装置生成的。
[0009]根据本公开的另一方面,提供了一种检索装置,包括:获取模块,用于获取检索项;以及检索模块,用于将所述检索项和多个候选语句输入至语言处理模型中,得到目标语句,
其中,所述语言处理模型是利用本公开所述的语言处理模型的训练装置训练得到的。
[0010]根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如本公开的方法。
[0011]根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行如本公开的方法。
[0012]根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如本公开的方法。
[0013]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0014]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0015]图1示意性示出了根据本公开实施例的可以应用检索方法及装置的示例性系统架构;
[0016]图2示意性示出了根据本公开实施例的样本生成方法的流程图;
[0017]图3示意性示出了根据本公开实施例的确定负样本语句对的示意图;
[0018]图4示意性示出了根据本公开实施例的确定正样本语句对的示意图;
[0019]图5示意性示出了根据本公开实施例的语言处理模型的训练方法的流程图;
[0020]图6示意性示出了根据本公开另一实施例的语言处理模型的训练方法的流程图;
[0021]图7示意性示出了根据本公开实施例的检索方法的流程图;
[0022]图8示意性示出了根据本公开实施例的样本生成装置的框图;
[0023]图9示意性示出了根据本公开实施例的语言处理模型的训练装置的框图;
[0024]图10示意性示出了根据本公开实施例的检索装置的框图;以及
[0025]图11示意性示出了根据本公开实施例的适于实现样本生成方法的电子设备的框图。
具体实施方式
[0026]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0027]本公开提供了一种样本生成方法、语言处理模型的训练方法、检索方法、装置、电子设备、存储介质以及程序产品。
[0028]根据本公开的一方面,提供了一种样本生成方法,包括:从语料集合中确定与待匹配语句相匹配的第一目标语句,将待匹配语句和第一目标语句,作为负样本语句对;从日志中获取搜索语句和与搜索语句相匹配的第二目标语句,将搜索语句和第二目标语句,作为正样本语句对;以及基于负样本语句对和正样本语句对,生成目标样本,其中,负样本语句
对之间的语义相关性大于第一预定阈值、且小于第二预定阈值,正样本语句对的语义相关性大于第二预定阈值。
[0029]根据本公开的另一方面,提供了一种语言处理模型的训练方法,包括:利用训练样本训练语言处理模型,得到经训练的语言处理模型,其中,训练样本是利用本公开的样本生成方法生成的。
[0030]根据本公开的另一方面,提供了一种检索方法,包括:获取检索项;以及将检索项和多个候选语句输入至语言处理模型中,得到目标语句,其中,语言处理模型是利用本公开的语言处理模型的训练方法训练得到的。
[0031]在本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供、公开和应用等处理,均符合相关法律法规的规定,采取了必要保密措施,且不违背公序良俗。
[0032]在本公开的技术方案中,在获取或采集用户个人信息之前,均获取了用户的授权或同意。
[0033]图1示意性示出了根据本公开实施例的可以应用检索方法及装置的示例性系统架构。
[0034]需要注意的是,图1所示仅为可以应用本公开本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种样本生成方法,包括:从语料集合中确定与待匹配语句相匹配的第一目标语句,将所述待匹配语句和所述第一目标语句,作为负样本语句对;从日志中获取搜索语句和与所述搜索语句相匹配的第二目标语句,将所述搜索语句和所述第二目标语句,作为正样本语句对;以及基于所述负样本语句对和所述正样本语句对,生成目标样本,其中,所述负样本语句对之间的语义相关性大于第一预定阈值、且小于第二预定阈值,所述正样本语句对的语义相关性大于所述第二预定阈值。2.根据权利要求1所述的方法,其中,所述从语料集合中确定与待匹配语句相匹配的第一目标语句包括:将所述待匹配语句输入至双塔模型中,得到所述待匹配语句的待匹配语句向量;以及基于所述待匹配语句向量和语句向量集合,从所述语料集合中确定与所述待匹配语句相匹配的所述第一目标语句,其中,所述语句向量集合是通过将所述语料集合中的多个语句输入至所述双塔模型中得到的,所述语句向量集合中的多个语句向量与所述语料集合中的多个语句一一对应。3.根据权利要求1或2所述的方法,其中,所述从日志中获取搜索语句和与所述搜索语句相匹配的第二目标语句包括:从所述日志中获取与所述搜索语句相匹配的多个初始目标语句;根据点击率,确定所述多个初始目标语句各自的关注度,得到多个关注度;以及基于所述多个关注度,从所述多个初始目标语句中确定所述第二目标语句。4.根据权利要求2所述的方法,其中,所述双塔模型是利用多个样本集合分阶段训练初始双塔模型得到的,其中,所述多个样本集合中的每个样本集合包括训练样本对,所述多个样本集合各自的训练样本对的语义相关性彼此不同。5.一种语言处理模型的训练方法,包括:利用训练样本训练语言处理模型,得到经训练的语言处理模型,其中,所述训练样本是利用根据权利要求1至4中任一项所述的方法生成的。6.根据权利要求5所述的方法,其中,所述训练样本包括第i训练样本和所述第i+1训练样本;其中,所述语言处理模型为第i语言处理模型;所述利用训练样本训练语言处理模型,得到经训练的语言处理模型包括:利用所述第i训练样本训练所述第i语言处理模型,得到第i+1语言处理模型,其中,所述第i训练样本包括第i负样本语句对,所述i为大于或者等于1的整数;以及利用所述第i+1训练样本训练所述第i+1语言处理模型,得到第i+2语言处理模型,将所述第i+2语言处理模型作为所述经训练的语言处理模型,其中,所述第i+1训练样本包括第i+1负样本语句对,其中,所述第i+1负样本语句对之间的语义相关性大于所述第i负样本语句对之间的语义相关性。7.根据权利要求6所述的方法,其中,所述第i训练样本还包括第i正样本语句对,所述第i+1训练样本还包括第i+1正样本语句对,
其中,所述第i+1正样本语句对中的正样本语句的关注度大于所述第i正样本语句对中的正样本语句的关注度。8.一种检索方法,包括:获取检索项;以及将所述检索项和多个候选语句输入至语言处理模型中,得到目标语句,其中,所述语言处理模型是利用根据权利要求5至7中任一项所述的方法训练得到的。9.一种样本生成装置,包括:第一确定模块,用于从语料集合中确定与待匹配语句相匹配的第一目标语句,将所述待匹配语句和所述第一目标语句,作为负样本语句对;第二确定模块,用于从日志中获取搜索语句和与所述搜索语句相匹配的第二目标语句,将所述搜索语句和所述第二目标语句,作为正样本语句对;以及生成模块,用于基于所述负样本语句对和所述正样本语句对,生成目标样本,其中,所述负样本语句对之间的语义相关性大于第一预定阈值、且小于第二预定阈值,所述正...

【专利技术属性】
技术研发人员:施云生黄正杰冯仕堃黄世维何径舟
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1