一种检索模型的训练方法和相关装置制造方法及图纸

技术编号:35305902 阅读:28 留言:0更新日期:2022-10-22 12:56
本申请实施例公开了一种检索模型的训练方法和相关装置,可应用于车载场景。获取样本对中第一内容的第一向量以及第二内容的第二向量。第一向量和第二向量包括多个通道特征,各个通道特征表示的信息不同,将第一向量和第二向量输入至初始检索模型中,通过初始检索模型根据各个第一通道特征分别与至少两个第二通道特征间的关联性,得到第一向量与第二向量间的多个待定相似度,提高了不同向量包括的多个通道特征间的交互次数,加强了第一向量和第二向量间的信息交流。将多个待定相似度中最大的待定相似度作为第一向量与第二向量间的相似度,从而通过更为准确的相似度和样本标签训练初始模型的参数,得到的检索模型的准确性更高。高。高。

【技术实现步骤摘要】
一种检索模型的训练方法和相关装置


[0001]本申请涉及人工智能
,特别是涉及一种检索模型的训练方法和相关装置。

技术介绍

[0002]随着互联网的发展,人们可随时通过互联网获取各种各样的信息。例如,当用户想要了解某个内容时,可将该内容相应的关键词输入到检索引擎,检索引擎通过在数据库中检索与关键词匹配的内容,并展示给用户。
[0003]相关技术中,会计算关键词与待展示内容间的相似度,若二者的相似度超过预设阈值,则将该待展示内容作为与关键词匹配的内容展示给用户。但是该种方式的准确率较低。

技术实现思路

[0004]为了解决上述技术问题,本申请提供了一种检索模型的训练方法和相关装置,用于提高检索模型的准确性。
[0005]本申请实施例公开了如下技术方案:
[0006]一方面,本申请实施例提供一种检索模型的训练方法,所述方法包括:
[0007]获取具有样本标签的样本对,所述样本对包括第一内容和第二内容,所述样本标签用于标识所述第一内容和所述第二内容是否具有关联性;
[0008]获取用于标识所述第一内容的第一向量,以及用于标识所述第二内容的第二向量;所述第一向量包括N个第一通道特征,所述第二向量包括M个第二通道特征,N为大于1的整数,M为大于1的整数;
[0009]将所述第一向量和所述第二向量输入至初始检索模型中,通过所述初始检索模型根据各个所述第一通道特征分别与至少两个所述第二通道特征间的关联性,得到所述第一向量与所述第二向量间的L个待定相似度;L为大于1的整数;
[0010]将所述L个待定相似度中最大的待定相似度作为所述第一向量与所述第二向量间的相似度;
[0011]根据所述第一向量与所述第二向量间的相似度,以及所述样本标签训练所述初始检索模型的参数,得到检索模型。
[0012]另一方面,本申请实施例提供一种检索模型的训练装置,所述装置包括:第一获取单元、第二获取单元、第一确定单元、第二确定单元和训练单元;
[0013]所述第一获取单元,用于获取具有样本标签的样本对,所述样本对包括第一内容和第二内容,所述样本标签用于标识所述第一内容和所述第二内容是否具有关联性;
[0014]所述第二获取单元,用于获取用于标识所述第一内容的第一向量,以及用于标识所述第二内容的第二向量;所述第一向量包括N个第一通道特征,所述第二向量包括M个第二通道特征,N为大于1的整数,M为大于1的整数;
[0015]所述第一确定单元,用于将所述第一向量和所述第二向量输入至初始检索模型中,通过所述初始检索模型根据各个所述第一通道特征分别与至少两个所述第二通道特征间的关联性,得到所述第一向量与所述第二向量间的L个待定相似度;L为大于1的整数;
[0016]所述第二确定单元,用于将所述L个待定相似度中最大的待定相似度作为所述第一向量与所述第二向量间的相似度;
[0017]所述训练单元,用于根据所述第一向量与所述第二向量间的相似度,以及所述样本标签训练所述初始检索模型的参数,得到检索模型。
[0018]另一方面,本申请实施例提供一种计算机设备,所述计算机设备包括处理器以及存储器:
[0019]所述存储器用于存储计算机程序,并将所述计算机程序传输给所述处理器;
[0020]所述处理器用于根据所述计算机程序中的指令执行上述方面所述的方法。
[0021]另一方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,所述计算机程序用于执行上述方面所述的方法。
[0022]另一方面,本申请实施例提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述方面所述的方法。
[0023]由上述技术方案可以看出,获取第一内容和第二内容构成的样本对,该样本对具有标识第一内容和第二内容是否具有关联性的样本标签。获取用于标识第一内容的第一向量以及用于标识第二内容的第二向量。其中,第一向量包括多个第一通道特征,第二向量包括多个第二通道特征。由于各个通道特征表示的信息不同,为了让第一向量和第二向量更好的交互,将第一向量和第二向量输入至初始检索模型中,通过初始检索模型根据各个第一通道特征分别与至少两个第二通道特征间的关联性,得到第一向量与第二向量间的多个待定相似度,提高了不同向量包括的多个通道特征间的交互次数,加强了第一向量和第二向量间的信息交流。将多个待定相似度中最大的待定相似度作为第一向量与第二向量间的相似度,相比于仅通过一次向量间交互得到的相似度更为准确。从而通过更为准确的相似度和样本标签训练初始模型的参数,得到的检索模型的准确性更高。由此,通过让不同向量间的多个通道特征进行交互提高向量间各个通道特征间的交互次数,从而加强不同向量间的信息交流,使得不同向量间的相似度更为准确,进而基于更为准确的相似度训练得到的检索模型的准确性更高,泛化性能更好。
附图说明
[0024]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0025]图1为本申请实施例提供的检索模型的训练方法的应用场景示意图;
[0026]图2为本申请实施例提供的检索模型的训练方法的流程示意图;
[0027]图3为本申请实施例提供的一种通过滚动方式确定待定相似度的示意图;
[0028]图4为本申请实施例提供的一种通过全通道相乘的方式确定待定相似度的示意图;
[0029]图5为本申请实施例提供的一种检索模型的训练和应用方法的场景示意图;
[0030]图6为本申请实施例提供的一种检索模型的训练装置的结构示意图;
[0031]图7为本申请实施例提供的服务器的结构示意图;
[0032]图8为本申请实施例提供的终端设备的结构示意图。
具体实施方式
[0033]下面结合附图,对本申请的实施例进行描述。
[0034]相关技术中,采用按位相乘的方式计算关键词与待展示内容间的相似度,例如,关键词对应的关键词向量包括三个通道特征,待展示内容对应的待展示内容向量包括三个通道特征,不同向量间的通道特征按照位置相乘,例如,关键词向量中处于第一个位置的通道特征与待展示内容向量中处于第一个位置的通道特征相乘,以此类推,从而得到关键词向量和待展示内容向量间的相似度。
[0035]但是,由于不同通道特征表征的信息不同,通过按位相乘的方式,只能让对应位置的通道特征进行交互,不同向量间不能很好的交互,导致计算出的不同向量间的相似度的准确率较低。例如,最能表现关键词含义的信息位于关键词向量的第二通道特征,最本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种检索模型的训练方法,其特征在于,所述方法包括:获取具有样本标签的样本对,所述样本对包括第一内容和第二内容,所述样本标签用于标识所述第一内容和所述第二内容是否具有关联性;获取用于标识所述第一内容的第一向量,以及用于标识所述第二内容的第二向量;所述第一向量包括N个第一通道特征,所述第二向量包括M个第二通道特征,N为大于1的整数,M为大于1的整数;将所述第一向量和所述第二向量输入至初始检索模型中,通过所述初始检索模型根据各个所述第一通道特征分别与至少两个所述第二通道特征间的关联性,得到所述第一向量与所述第二向量间的L个待定相似度;L为大于1的整数;将所述L个待定相似度中最大的待定相似度作为所述第一向量与所述第二向量间的相似度;根据所述第一向量与所述第二向量间的相似度,以及所述样本标签训练所述初始检索模型的参数,得到检索模型。2.根据权利要求1所述的方法,其特征在于,若N等于M,所述通过所述初始检索模型根据各个所述第一通道特征分别与至少两个所述第二通道特征间的关联性,得到所述第一向量与所述第二向量间的L个待定相似度,包括:通过所述初始检索模型,按照预设步长对所述第二向量中M个所述第二通道特征进行K次滚动,得到K个第二滚动向量,并将K个所述第二滚动向量和所述第二向量作为第二向量集合,所述第二滚动向量包括M个所述第二通道特征,K为正整数;根据所述第一向量与所述第二向量集合中的向量,按照通道特征的位置确定第一通道特征的关联性,其中,所述第一向量中第n个所述第一通道特征的关联性是根据第n个所述第一通道特征与所述第二向量中集合中各个向量的第n个所述第二通道特征确定的,n为小于N的整数;根据所述第一通道特征的关联性,得到所述第一向量与所述第二向量间的L个待定相似度。3.根据权利要求2所述的方法,其特征在于,在所述得到K个第二滚动向量之后,所述方法还包括:通过所述初始检索模型,按照所述预设步长对所述第一向量中N个所述第一通道特征进行K次滚动,得到K个第一滚动向量,并将K个所述第一滚动向量和所述第一向量作为第一向量集合,所述第一滚动向量包括N个所述第一通道特征;根据所述第一向量集合中的向量与所述第二向量,按照通道特征的位置确定针对第二通道特征的关联性,其中,所述第二向量中第m个所述第二通道特征的关联性是根据第m个所述第二通道特征与所述第一向量中集合中各个向量的第m个所述第一通道特征确定的,m为小于M的整数;所述根据所述第一通道特征的关联性,得到所述第一向量与所述第二向量间的L个待定相似度,包括:根据所述第一通道特征的关联性和所述第二通道特征的关联性,得到所述第一向量与所述第二向量间的L个待定相似度。4.根据权利要求1所述的方法,其特征在于,所述第一向量包括I个第一子向量,每个所
述第一子向量包括N个所述第一通道特征,所述第二向量包括J个第二子向量,每个所述第二子向量包括M个所述第二通道特征,所述通过所述初始检索模型根据各个所述第一通道特征分别与至少两个所述第二通道特征间的关联性,得到所述第一向量与所述第二向量间的L个待定相似度,包括:针对目标第一子向量和目标第二子向量,通过所述初始检索模型根据所述目标第一子向量包括的N个所述第一通道特征分别和所述目标第二子向量包括的M个所述第二通道特征间的关联性,得到所述目标第一子向量和所述目标第二子向量的待定相似度;所述目标第一子向量为I个所述第一子向量中的一个,所述目标第二子向量为J个所述第二子向量中的一个;将I个所述第一子向量分别作为所述目标第一子向量,将J个所述第二子向量分别作为所述目标第二子向量,得到所述第一子向量与所述第二子向量间的I*J个待定相似度;根据所述第一子向量与所述第二子向量间的I*J个待定相似度,确定所述第一向量与所述第二向量间的L个待定相似度。5.根据权利要求4所述的方法,其特征在于,所述根据所述第一子向量与所述第二子向量间的I*J个待定相似度,确定所述第一向量与所述第二向量间的L个待定相似度,包括:针对I个所述第一子向量中第i个所述第一子向量,将第i个所述第一子向量与所述第二子向量间的J个待定相似度中最大的相似度作为第i个所述第一子向量与所述第二子向量间的相似度;i为小于I的正整数;根据I个所述第一子向量分别与所述第二子向量间的相似度,确定所述第一向量与所述第二向量间的待定相似度。6.根据权利要求5所述的方法,其特征在于,所述方法还包括:针对J个所述第二子向量中第j个所述第二子向量,将第j个所述第二子向量与所述第一子向量间的I个待定相似度中最大的相似度作为第j个所述第二子向量与所述第一子向量间的相似度;j为小于J的正整数;所述根据I个所述第一子向量分别与所述第二子向量间的相似度,确定所述第一向量与所述第二向量间的待定相似度,包括:根据I个所述第一子向量分别与所述第二子向量间的相似度,以及J个所述第二子向量与所述第一子向量间的相似度,确定所述第一向量与所述第二向量间的相似度。7.根据权利要求6所述的方法,其特征在于,所述方法还包括:获取I个所述第一子向量分别在所述第一向量中的第一...

【专利技术属性】
技术研发人员:全卫泽刘烁陈思宏陈宸严冬明
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1