特征提取模型的训练方法、装置、设备、介质及程序产品制造方法及图纸

技术编号:33708991 阅读:13 留言:0更新日期:2022-06-06 08:37
本申请提供了一种特征提取模型的训练方法、装置、设备、存储介质及计算机程序产品;方法包括:通过训练得到的至少一个历史版本的特征提取模型,分别对多个携带样本标签的训练样本进行特征提取,得到各所述历史版本对应的多个样本特征;基于各所述历史版本对应的多个样本特征,确定任意两个所述训练样本间的样本相似度;基于确定的样本相似度,从所述多个训练样本中选取至少一个训练样本对,所述训练样本对包括第一训练样本及第二训练样本;基于选取的所述至少一个训练样本对,对目标特征提取模型进行训练,得到训练完成的特征提取模型;通过本申请,能够提高特征提取模型的训练效率,并提高训练得到的特征提取模型的特征提取精度。度。度。

【技术实现步骤摘要】
特征提取模型的训练方法、装置、设备、介质及程序产品


[0001]本申请涉及人工智能
,尤其涉及一种特征提取模型的训练方法、装置、设备、存储介质及计算机程序产品。

技术介绍

[0002]人工智能(AI,Artificial Intelligence)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法和技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
[0003]人工智能已经越来越多地应用于特征提取方面。相关技术中,通常采用已有的全量训练样本,对特征提取模型进行多次迭代,以得到训练完成的特征提取模型。但是有些训练样本在训练过程中,其预测得到的结果和样本标签差别很大,此类训练样本会导致模型学习的精度降低,而相关技术中在每次迭代过程中均采用全量训练样本的话,很难关注到此类训练样本,如此不仅降低了模型训练效率,还使得模型学习效果不佳。

技术实现思路

[0004]本申请实施例提供一种特征提取模型的训练方法、装置、设备、存储介质及计算机程序产品,能够提高特征提取模型的训练效率,并提高训练得到的特征提取模型的特征提取精度。
[0005]本申请实施例的技术方案是这样实现的:
[0006]本申请实施例提供一种特征提取模型的训练方法,包括:
[0007]通过训练得到的至少一个历史版本的特征提取模型,分别对多个携带样本标签的训练样本进行特征提取,得到各所述历史版本对应的多个样本特征;
[0008]基于各所述历史版本对应的多个样本特征,确定任意两个所述训练样本间的样本相似度;
[0009]基于确定的样本相似度,从所述多个训练样本中选取至少一个训练样本对,所述训练样本对包括第一训练样本及第二训练样本;
[0010]其中,所述第一训练样本与所述第二训练样本满足以下关系中至少之一:
[0011]样本标签相同、且在所述多个训练样本中,与第一训练样本的样本相似度最小的训练样本为第二训练样本;样本标签不同,且在所述多个训练样本中,与第一训练样本的样本相似度最大的训练样本为第二训练样本;
[0012]基于选取的所述至少一个训练样本对,对目标特征提取模型进行训练,得到训练完成的特征提取模型。
[0013]本申请实施例还提供一种特征提取模型的训练装置,包括:
[0014]特征提取模块,用于通过训练得到的至少一个历史版本的特征提取模型,分别对
多个携带样本标签的训练样本进行特征提取,得到各所述历史版本对应的多个样本特征;
[0015]确定模块,用于基于各所述历史版本对应的多个样本特征,确定任意两个所述训练样本间的样本相似度;
[0016]选取模块,用于基于确定的样本相似度,从所述多个训练样本中选取至少一个训练样本对,所述训练样本对包括第一训练样本及第二训练样本;
[0017]其中,所述第一训练样本与所述第二训练样本满足以下关系中至少之一:
[0018]样本标签相同、且在所述多个训练样本中,与第一训练样本的样本相似度最小的训练样本为第二训练样本;样本标签不同,且在所述多个训练样本中,与第一训练样本的样本相似度最大的训练样本为第二训练样本;
[0019]训练模块,用于基于选取的所述至少一个训练样本对,对目标特征提取模型进行训练,得到训练完成的特征提取模型。
[0020]上述方案中,所述确定模块,还用于确定各所述历史版本对应的任意两个样本特征间的特征相似度;基于各所述历史版本对应的任意两个样本特征间的特征相似度,确定所述任意两个样本特征所对应训练样本间的样本相似度,以确定任意两个所述训练样本间的样本相似度。
[0021]上述方案中,当所述历史版本的数量为至少两个时,所述确定模块,还用于获取各所述历史版本对应的权重值;基于各所述历史版本对应的权重值,对各所述历史版本对应的任意两个样本特征间的特征相似度进行加权平均处理,得到所述任意两个样本特征所对应训练样本间的样本相似度。
[0022]上述方案中,所述确定模块,还用于获取各所述历史版本对应的特征相似度矩阵,所述特征相似度矩阵中的第(i,j)个矩阵元素,为相应历史版本对应的第i个样本特征和第j个样本特征间的特征相似度;基于各所述历史版本对应的特征相似度矩阵,确定多个所述训练样本对应的样本相似度矩阵;将所述样本相似度矩阵中的第(i,j)个矩阵元素,作为多个所述训练样本中第i个训练样本和第j个训练样本间的样本相似度,以确定任意两个所述训练样本间的样本相似度;其中,所述i和所述j,均为大于零且不超过m的整数,所述m为所述训练样本的数量。
[0023]上述方案中,所述确定模块,还用于针对各所述历史版本,分别执行如下处理:针对所述历史版本对应的第i个样本特征和第j个样本特征,确定所述第i个样本特征和第j个样本特征间的特征相似度,并将所述特征相似度作为所述特征相似度矩阵中的第(i,j)个矩阵元素,以得到所述历史版本对应的特征相似度矩阵。
[0024]上述方案中,当所述历史版本的数量为至少两个时,所述确定模块,还用于获取各所述历史版本对应的权重值;基于各所述历史版本对应的权重值,对至少两个所述特征相似度矩阵进行加权平均处理,得到多个所述训练样本对应的样本相似度矩阵。
[0025]上述方案中,所述确定模块,还用于获取各所述历史版本的特征提取模型对应的模型评估指标的指标值;基于各所述历史版本的特征提取模型对应的指标值,确定相应历史版本对应的权重值。
[0026]上述方案中,所述选取模块,还用于各所述训练样本对分别通过执行如下处理得到:从所述多个训练样本中,选取一个训练样本作为所述第一训练样本;确定样本标签与所述第一训练样本的样本标签相同的训练样本为正训练样本,并确定样本标签与所述第一训
练样本的样本标签不同的训练样本为负训练样本;从所述正训练样本和所述负训练样本中,选取目标训练样本作为所述第二训练样本;其中,所述目标训练样本为以下训练样本中至少之一:所述正训练样本中,与所述第一训练样本的样本相似度最小的正训练样本;所述负训练样本中,与所述第一训练样本的样本相似度最大的负训练样本。
[0027]上述方案中,所述训练模块,还用于通过所述目标特征提取模型,对所述至少一个训练样本对中各训练样本进行特征提取,得到相应的预测样本特征;获取各所述预测样本特征与相应训练样本的样本标签之间的差异;基于所述差异,更新所述目标特征提取模型的模型参数,以得到训练完成的特征提取模型。
[0028]上述方案中,所述第二训练样本包括:样本标签相同、且在所述多个训练样本中,与第一训练样本的样本相似度最小的正训练样本;以及样本标签不同,且在所述多个训练样本中,与第一训练样本的样本相似度最大的负训练样本;所述训练模块,还用于通过所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种特征提取模型的训练方法,其特征在于,所述方法包括:通过训练得到的至少一个历史版本的特征提取模型,分别对多个携带样本标签的训练样本进行特征提取,得到各所述历史版本对应的多个样本特征;基于各所述历史版本对应的多个样本特征,确定任意两个所述训练样本间的样本相似度;基于确定的样本相似度,从所述多个训练样本中选取至少一个训练样本对,所述训练样本对包括第一训练样本及第二训练样本;其中,所述第一训练样本与所述第二训练样本满足以下关系中至少之一:样本标签相同、且在所述多个训练样本中,与第一训练样本的样本相似度最小的训练样本为第二训练样本;样本标签不同,且在所述多个训练样本中,与第一训练样本的样本相似度最大的训练样本为第二训练样本;基于选取的所述至少一个训练样本对,对目标特征提取模型进行训练,得到训练完成的特征提取模型。2.如权利要求1所述的方法,其特征在于,所述基于各所述历史版本对应的多个样本特征,确定任意两个所述训练样本间的样本相似度,包括:确定各所述历史版本对应的任意两个样本特征间的特征相似度;基于各所述历史版本对应的任意两个样本特征间的特征相似度,确定所述任意两个样本特征所对应训练样本间的样本相似度,以确定任意两个所述训练样本间的样本相似度。3.如权利要求2所述的方法,其特征在于,当所述历史版本的数量为至少两个时,所述基于各所述历史版本对应的任意两个样本特征间的特征相似度,确定所述任意两个样本特征所对应训练样本间的样本相似度,包括:获取各所述历史版本对应的权重值;基于各所述历史版本对应的权重值,对各所述历史版本对应的任意两个样本特征间的特征相似度进行加权平均处理,得到所述任意两个样本特征所对应训练样本间的样本相似度。4.如权利要求1所述的方法,其特征在于,所述基于各所述历史版本对应的多个样本特征,确定任意两个所述训练样本间的样本相似度,包括:获取各所述历史版本对应的特征相似度矩阵,所述特征相似度矩阵中的第(i,j)个矩阵元素,为相应历史版本对应的第i个样本特征和第j个样本特征间的特征相似度;基于各所述历史版本对应的特征相似度矩阵,确定多个所述训练样本对应的样本相似度矩阵;将所述样本相似度矩阵中的第(i,j)个矩阵元素,作为多个所述训练样本中第i个训练样本和第j个训练样本间的样本相似度,以确定任意两个所述训练样本间的样本相似度;其中,所述i和所述j,均为大于零且不超过m的整数,所述m为所述训练样本的数量。5.如权利要求4所述的方法,其特征在于,所述获取各所述历史版本对应的特征相似度矩阵,包括:针对各所述历史版本,分别执行如下处理:针对所述历史版本对应的第i个样本特征和第j个样本特征,确定所述第i个样本特征和第j个样本特征间的特征相似度,并
将所述特征相似度作为所述特征相似度矩阵中的第(i,j)个矩阵元素,以得到所述历史版本对应的特征相似度矩阵。6.如权利要求4所述的方法,其特征在于,所述历史版本的数量为至少两个,所述基于各所述历史版本对应的特征相似度矩阵,确定多个所述训练样本对应的样本相似度矩阵,包括:获取各所述历史版本对应的权重值;基于各所述历史版本对应的权重值,对至少两个所述特征相似度矩阵进行加权平均处理,得到多个所述训练样本对应的样本相似度矩阵。7.如权利要求3或6所述的方法,其特征在于,所述获取各所述历史版本对应的权重值,包括:获取各所述历史版本的特征提取模型对应的模型评估指标的指标值;基于各所述历史版本的特征提取模型对应的指标值,确定相应历史版本对应的权重值。8.如权利要求1所述的方法,其特征在于,所述基于确定的样本相似度,从所述多个训练样本中选取至少一个训练样本对,包括:各所述训练样本对分别通过执行如下处理得到:从所述多个训练样本中,选取一个训练样本作为所述第一训练样本;确定样本标签与所述第一训练样本的样本标签相同的训练样本为正训练样本,并确定样本标签与所述第一训练样本的样本标签不同的训练样本为负训练样本;从所述正训练样本和所述负训练样本中,选取目标训练样本作为所述第二训练样本;其中,所...

【专利技术属性】
技术研发人员:张皓
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1