模型训练方法、装置、系统、行人重识别方法制造方法及图纸

技术编号：33361761 阅读：11 留言：0更新日期：2022-05-11 22:17

本申请公开了一种模型训练方法、装置、系统、行人重识别方法。其中，该方法包括：采用第一机器学习模型提取目标训练数据集中各样本的样本特征，得到第一特征集合；采用第二机器学习模型提取目标训练数据集中各样本的样本特征，得到第二特征集合；确定第一特征集合中指定特征和第二特征集合中与指定特征对应的特征的相似度；按照所述相似度进行排序，并计算排序结果的准确度指标；基于准确度指标确定损失函数，基于该损失函数对第二机器学习模型进行训练。本申请解决了相关技术为保证新旧特征的兼容性而直接约束新特征与旧特征分布尽可能相似，导致对新模型的性能损害较大的技术问题。问题。问题。

全部详细技术资料下载

【技术实现步骤摘要】
模型训练方法、装置、系统、行人重识别方法

[0001]本申请涉及机器学习领域，具体而言，涉及一种模型训练方法、装置、系统、行人重识别方法。

技术介绍

[0002]在真实的行人重识别系统中模型更新迭代是一个普遍的需求，但是检索库中已入库图像的特征由旧模型提取，而未入库图像的特征将由更新的新模型进行提取。由于新旧模型参数存在差异，新模型提取的图像特征无法兼容旧模型提取的特征，导致新旧模型提取的图像特征无法进行互相检索，即新模型无法向后兼容。工程上的解决方案为利用新模型进行刷库，即利用新模型对于已存图像重新提取一遍特征，但是这个计算开销很大。目前提出的特征向后兼容，是指在算法层面使得新模型能够兼容旧模型特征，已有的方案大多直接约束新旧模型的特征分布，但是这种方法对于新模型的性能损害较大。
[0003]针对上述的问题，目前尚未提出有效的解决方案。

技术实现思路

[0004]本申请实施例提供了一种模型训练方法、装置、系统、行人重识别方法，以至少解决相关技术为保证新旧特征的兼容性而直接约束新特征与旧特征分布尽可能相似，导致对新模型的性能损害较大的技术问题。
[0005]根据本申请实施例的一个方面，提供了一种模型训练方法，包括：采用第一机器学习模型提取目标训练数据集中各个样本的样本特征，得到第一特征集合；采用第二机器学习模型提取所述目标训练数据集中各个样本的样本特征，得到第二特征集合，其中，所述第一机器学习模型和第二机器学习模型的模型结构相同，且采用的训练数据不同；确定所述第一特征集合中指定特征和所...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法，包括：采用第一机器学习模型提取目标训练数据集中各个样本的样本特征，得到第一特征集合；采用第二机器学习模型提取所述目标训练数据集中各个样本的样本特征，得到第二特征集合，其中，所述第一机器学习模型和第二机器学习模型的模型结构相同，但采用的训练数据不同；确定所述第一特征集合中指定特征和所述第二特征集合中与所述指定特征对应的特征的相似度；按照所述相似度进行排序，并计算排序结果的准确度指标；基于所述准确度指标确定损失函数，以及基于该损失函数对所述第二机器学习模型进行训练。2.根据权利要求1所述的方法，其中，确定所述第一特征集合中指定特征和所述第二特征集合中与所述指定特征对应的特征的相似度之前，所述方法还包括：确定所述第一特征集合中各个样本子集的类别特征中心，并计算所述各个样本子集的特征中心之间的相似度，得到多个相似度，其中，所述样本子集是依据特征类型对所述第一特征集合中的特征进行划分得到的；比较所述多个相似度的大小；基于比较结果从所述第一特征集合中筛选出目标样本子集，并从每个所述目标样本子集中选择所述指定特征。3.根据权利要求2所述的方法，其中，基于所述多个相似度从所述第一特征集合中筛选出目标样本子集，包括：对所述相似度按照从大到小的顺序进行排序，将排名靠前的第一数量个样本子集作为所述目标样本子集。4.根据权利要求3所述的方法，其中，所述第一数量为预先指定的数量。5.根据权利要求2所述的方法，其中，基于所述多个相似度从所述第一特征集合中筛选出目标样本子集，包括：比较所述多个相似度与预设阈值；确定所述多个相似度中大于阈值的目标相似度，将所述目标相似度对应的样本子集作为所述目标样本子集。6.根据权利要求2所述的方法，其中，从每个所述目标样本子集中选择所述指定特征，包括：从每个所述目标样本子集中随机选择第二数量的样本特征，得到所述指定特征，其中，所述第二数量为预先指定的数量。7.根据权利要求2所述的方法，其中，所述样本子集是依据以下方式对所述第一特征集合中的特征进行划分的：基于所述第一特征集合中各个特征所对应的目标对象，将所述第一特征集合中的特征划分至不同的样本子集，其中，不同的样本子集中的特征分属于不同目标对象。8.根据权利要求1所述的方法，其中，所述准确度指标包括：平均准确度指标；基于所述准确度指标确定损失函数，包括：对所述平均准确度指标应的平均准确度函数进行近似操作计算，得到可导的光滑的平
均准确度函数；对所述平均准确度函数进行最小化处理，得到所述损失函数。9.根据权利要求1至8中任意一项所述的方法，其中，所述第一机器学习模型采用的训练数据所对应的采集时间早于所述第二机器学习模型所采用的训练数据所对应的采集时间。10.一种行人重识别方法，其中，包括：获取目标视频数据中的行人图像；将所述行人图像输入至预设机器学习模型进行...

【专利技术属性】
技术研发人员：罗浩，陈威华，王帆，李昊，
申请(专利权)人：阿里巴巴集团控股有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人