模型训练方法、装置、系统、行人重识别方法制造方法及图纸

技术编号:33361761 阅读:11 留言:0更新日期:2022-05-11 22:17
本申请公开了一种模型训练方法、装置、系统、行人重识别方法。其中,该方法包括:采用第一机器学习模型提取目标训练数据集中各样本的样本特征,得到第一特征集合;采用第二机器学习模型提取目标训练数据集中各样本的样本特征,得到第二特征集合;确定第一特征集合中指定特征和第二特征集合中与指定特征对应的特征的相似度;按照所述相似度进行排序,并计算排序结果的准确度指标;基于准确度指标确定损失函数,基于该损失函数对第二机器学习模型进行训练。本申请解决了相关技术为保证新旧特征的兼容性而直接约束新特征与旧特征分布尽可能相似,导致对新模型的性能损害较大的技术问题。问题。问题。

【技术实现步骤摘要】
模型训练方法、装置、系统、行人重识别方法


[0001]本申请涉及机器学习领域,具体而言,涉及一种模型训练方法、装置、系统、行人重识别方法。

技术介绍

[0002]在真实的行人重识别系统中模型更新迭代是一个普遍的需求,但是检索库中已入库图像的特征由旧模型提取,而未入库图像的特征将由更新的新模型进行提取。由于新旧模型参数存在差异,新模型提取的图像特征无法兼容旧模型提取的特征,导致新旧模型提取的图像特征无法进行互相检索,即新模型无法向后兼容。工程上的解决方案为利用新模型进行刷库,即利用新模型对于已存图像重新提取一遍特征,但是这个计算开销很大。目前提出的特征向后兼容,是指在算法层面使得新模型能够兼容旧模型特征,已有的方案大多直接约束新旧模型的特征分布,但是这种方法对于新模型的性能损害较大。
[0003]针对上述的问题,目前尚未提出有效的解决方案。

技术实现思路

[0004]本申请实施例提供了一种模型训练方法、装置、系统、行人重识别方法,以至少解决相关技术为保证新旧特征的兼容性而直接约束新特征与旧特征分布尽可能相似,导致对新模型的性能损害较大的技术问题。
[0005]根据本申请实施例的一个方面,提供了一种模型训练方法,包括:采用第一机器学习模型提取目标训练数据集中各个样本的样本特征,得到第一特征集合;采用第二机器学习模型提取所述目标训练数据集中各个样本的样本特征,得到第二特征集合,其中,所述第一机器学习模型和第二机器学习模型的模型结构相同,且采用的训练数据不同;确定所述第一特征集合中指定特征和所述第二特征集合中与所述指定特征对应的特征的相似度;按照所述相似度进行排序,并计算排序结果的准确度指标;基于所述准确度指标确定损失函数,以及基于该损失函数对所述第二机器学习模型进行训练。
[0006]根据本申请实施例的另一方面,还提供了一种行人重识别方法,包括:获取目标视频数据中的行人图像;将所述行人图像输入至预设机器学习模型进行识别,得到所述行人图像的识别结果,其中,所述预设机器学习模型为基于第一机器学习模型从目标训练数据集提取的样本特征和第二机器学习模型从所述目标训练数据集中提取的样本特征训练得到的,其中,所述第一机器学习模型和第二机器学习模型的模型结构相同,但采用的训练数据不同;且所述预设机器学习模型的损失函数为基于以下方式确定的:所述第一机器学习模型提取的特征和第二机器学习模型提取的特征按照相似度进行排序后,依据排序结果的准确度指标确定的。
[0007]根据本申请实施例的另一方面,还提供了一种模型训练装置,包括:第一提取模块,用于采用第一机器学习模型提取目标训练数据集中各个样本的样本特征,得到第一特征集合;第二提取模块,用于采用第二机器学习模型提取所述目标训练数据集中各个样本
的样本特征,得到第二特征集合,其中,所述第一机器学习模型和第二机器学习模型的模型结构相同,但采用的训练数据不同;确定模块,用于确定所述第一特征集合中指定特征和所述第二特征集合中与所述指定特征对应的特征的相似度;计算模块,用于按照所述相似度进行排序,并计算排序结果的准确度指标;训练模块,用于基于所述准确度指标确定损失函数,以及基于该损失函数对所述第二机器学习模型进行训练。
[0008]根据本申请实施例的另一方面,还提供了一种非易失性存储介质,所述非易失性存储介质包括存储的程序,其中,在所述程序运行时控制所述非易失性存储介质所在设备执行上述的模型训练方法。
[0009]根据本申请实施例的另一方面,还提供了一种计算设备,包括:处理器;以及存储器,与所述处理器连接,用于为所述处理器提供处理以下处理步骤的指令:采用第一机器学习模型提取目标训练数据集中各个样本的样本特征,得到第一特征集合;采用第二机器学习模型提取所述目标训练数据集中各个样本的样本特征,得到第二特征集合,其中,所述第一机器学习模型和第二机器学习模型的模型结构相同,但采用的训练数据不同;确定所述第一特征集合中指定特征和所述第二特征集合中与所述指定特征对应的特征的相似度;按照所述相似度进行排序,并计算排序结果的准确度指标;基于所述准确度指标确定损失函数,以及基于该损失函数对所述第二机器学习模型进行训练。
[0010]根据本申请实施例的另一方面,还提供了一种模型训练系统,包括:客户端设备和服务器,其中:所述客户端设备,用于向目标对象提供人机交互界面,并通过所述人机交互界面调用服务器中的程序指令执行以下步骤:采用第一机器学习模型提取目标训练数据集中各个样本的样本特征,得到第一特征集合;采用第二机器学习模型提取所述目标训练数据集中各个样本的样本特征,得到第二特征集合,其中,所述第一机器学习模型和第二机器学习模型的模型结构相同,但采用的训练数据不同;确定所述第一特征集合中指定特征和所述第二特征集合中与所述指定特征对应的特征的相似度;按照所述相似度进行排序,并计算排序结果的准确度指标;基于所述准确度指标确定损失函数,以及基于该损失函数对所述第二机器学习模型进行训练。
[0011]在本申请的一些实施例中,采用第一机器学习模型提取目标训练数据集中各样本的样本特征,得到第一特征集合;采用第二机器学习模型提取目标训练数据集中各样本的样本特征,得到第二特征集合;确定第一特征集合中指定特征和第二特征集合中与指定特征对应的特征的相似度;按照所述相似度进行排序,并计算排序结果的准确度指标;基于准确度指标确定损失函数,基于该损失函数对第二机器学习模型进行训练的方式,由于本方法是对新旧特征的排序进行约束,因此对于新模型特征分布的约束较弱,对于新模型性能的影响较小,同时本方法直接优化新旧特征排序的准确度,可以大大提高新模型的向后兼容性,无需进行刷库操作,进而解决了相关技术为保证新旧特征的兼容性而直接约束新特征与旧特征分布尽可能相似,导致对新模型的性能损害较大的技术问题。
附图说明
[0012]此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
[0013]图1是根据相关技术的一种模型训练方法示意图;
[0014]图2是根据本申请实施例的一种模型训练方法示意图;
[0015]图3是根据本申请实施例的一种计算机终端的硬件结构框图;
[0016]图4是根据本申请实施例的一种模型训练方法的流程示意图;
[0017]图5是根据本申请实施例的一种模型训练方法示意图;
[0018]图6是根据本申请实施例的一种行人重识别方法的流程示意图;
[0019]图7是根据本申请实施例的一种模型训练装置的结构示意图;
[0020]图8是根据本申请实施例的一种计算设备的结构示意图;
[0021]图9是根据本申请实施例的一种模型训练系统的结构示意图。
具体实施方式
[0022]为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法,包括:采用第一机器学习模型提取目标训练数据集中各个样本的样本特征,得到第一特征集合;采用第二机器学习模型提取所述目标训练数据集中各个样本的样本特征,得到第二特征集合,其中,所述第一机器学习模型和第二机器学习模型的模型结构相同,但采用的训练数据不同;确定所述第一特征集合中指定特征和所述第二特征集合中与所述指定特征对应的特征的相似度;按照所述相似度进行排序,并计算排序结果的准确度指标;基于所述准确度指标确定损失函数,以及基于该损失函数对所述第二机器学习模型进行训练。2.根据权利要求1所述的方法,其中,确定所述第一特征集合中指定特征和所述第二特征集合中与所述指定特征对应的特征的相似度之前,所述方法还包括:确定所述第一特征集合中各个样本子集的类别特征中心,并计算所述各个样本子集的特征中心之间的相似度,得到多个相似度,其中,所述样本子集是依据特征类型对所述第一特征集合中的特征进行划分得到的;比较所述多个相似度的大小;基于比较结果从所述第一特征集合中筛选出目标样本子集,并从每个所述目标样本子集中选择所述指定特征。3.根据权利要求2所述的方法,其中,基于所述多个相似度从所述第一特征集合中筛选出目标样本子集,包括:对所述相似度按照从大到小的顺序进行排序,将排名靠前的第一数量个样本子集作为所述目标样本子集。4.根据权利要求3所述的方法,其中,所述第一数量为预先指定的数量。5.根据权利要求2所述的方法,其中,基于所述多个相似度从所述第一特征集合中筛选出目标样本子集,包括:比较所述多个相似度与预设阈值;确定所述多个相似度中大于阈值的目标相似度,将所述目标相似度对应的样本子集作为所述目标样本子集。6.根据权利要求2所述的方法,其中,从每个所述目标样本子集中选择所述指定特征,包括:从每个所述目标样本子集中随机选择第二数量的样本特征,得到所述指定特征,其中,所述第二数量为预先指定的数量。7.根据权利要求2所述的方法,其中,所述样本子集是依据以下方式对所述第一特征集合中的特征进行划分的:基于所述第一特征集合中各个特征所对应的目标对象,将所述第一特征集合中的特征划分至不同的样本子集,其中,不同的样本子集中的特征分属于不同目标对象。8.根据权利要求1所述的方法,其中,所述准确度指标包括:平均准确度指标;基于所述准确度指标确定损失函数,包括:对所述平均准确度指标应的平均准确度函数进行近似操作计算,得到可导的光滑的平
均准确度函数;对所述平均准确度函数进行最小化处理,得到所述损失函数。9.根据权利要求1至8中任意一项所述的方法,其中,所述第一机器学习模型采用的训练数据所对应的采集时间早于所述第二机器学习模型所采用的训练数据所对应的采集时间。10.一种行人重识别方法,其中,包括:获取目标视频数据中的行人图像;将所述行人图像输入至预设机器学习模型进行...

【专利技术属性】
技术研发人员:罗浩陈威华王帆李昊
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1