图像识别模型训练及图像识别方法、装置、电子设备制造方法及图纸

技术编号:33500276 阅读:31 留言:0更新日期:2022-05-19 01:10
本发明专利技术提供的图像识别模型训练及图像识别方法、装置、电子设备,包括获得至少一组训练图像;根据多张图像样本和预设的权重矩阵,对初始的度量学习模型的损失函数进行迭代训练,直到损失函数处于收敛状态,得到训练后的图像识别模型;其中,权重矩阵用于维护每一类图像对应的中心向量;其中,损失函数是基于每次迭代训练中每张图像样本的特征向量和权重矩阵构建的;迭代训练用于使第一图像样本的特征向量与权重矩阵中的第一中心向量之间的夹角变小,且使除第一图像样本以外的剩余图像样本的特征向量,与第一中心向量的对称向量之间的夹角变小,本发明专利技术能够在大规模数据集的情况下,加快模型训练的优化效率。加快模型训练的优化效率。加快模型训练的优化效率。

【技术实现步骤摘要】
图像识别模型训练及图像识别方法、装置、电子设备


[0001]本专利技术涉及人工智能
,具体而言,涉及一种图像识别模型训练及图像识别方法、装置、电子设备。

技术介绍

[0002]随着人工智能技术的发展,在行人重识别、车辆重识别以及多目标跟踪的识别任务中,通常会采用深度神经网络,这种深度神经网络大多会基于softmax交叉熵损失函数的多分类框架进行模型训练,训练得到的模型可以在各个领域获得极高的识别效果。
[0003]然而,随着训练样本的类别的增加,尤其是人脸识别的训练任务有可能达到上亿类别的训练样本,导致上述训练方式所需的训练时间成本非常高,模型的优化效率较低,同时,相关技术为了克服这一缺陷,从而实现可以在较短时间内完成网络的训练的效果,通过引入相当多的超参数的方式来进行训练,这无疑为训练模型的调参带来了更大的工作量。
[0004]因此,如何在样本量较大的情况下,提供一种优化效率高的模型训练方式,是需要解决的技术问题。

技术实现思路

[0005]本专利技术的目的之一在于提供一种图像识别模型训练及图像识别方法、本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种图像识别模型训练方法,其特征在于,所述方法包括:获得至少一组训练图像;所述至少一组训练图像中包括多张图像样本;根据所述多张图像样本和预设的权重矩阵,对初始的度量学习模型的损失函数进行迭代训练,直到所述损失函数处于收敛状态,得到训练后的图像识别模型;其中,所述权重矩阵用于维护每一类图像对应的中心向量;其中,所述损失函数是基于每次迭代训练中每张图像样本的特征向量和所述权重矩阵构建的;所述迭代训练用于使第一图像样本的特征向量与所述权重矩阵中的第一中心向量之间的夹角变小,且使除所述第一图像样本以外的剩余图像样本的特征向量,与所述第一中心向量的对称向量之间的夹角变小;其中,所述第一图像样本为所述多张图像样本中的任一个,所述第一中心向量与所述第一图像样本的类标签值对应。2.根据权利要求1所述的图像识别模型训练方法,其特征在于,根据所述多张图像样本和预设的权重矩阵,对初始的度量学习模型的损失函数进行迭代训练,直到所述损失函数处于收敛状态,得到训练后的图像识别模型,包括:将所述多张图像样本输入到所述初始的度量学习模型中,获得每张图像样本的特征向量;根据所述每张图像样本的特征向量、所述权重矩阵,计算所述损失函数的损失值,并基于所述损失值更新所述权重矩阵以及所述特征向量;在每次迭代训练中,基于更新后的所述权重矩阵以及更新后的所述每张图像样本的特征向量,更新所述损失函数的损失值;当确定所述损失函数的损失值小于或等于预设阈值,则确定所述损失函数处于收敛状态,得到训练后的度量学习模型,并将所述训练后的度量学习模型作为所述图像识别模型。3.根据权利要求1所述的图像识别模型训练方法,其特征在于,所述损失函数是通过如下方式构建的:在每次迭代训练过程中,获更新后的每张图像样本的特征向量、以及更新后的所述权重矩阵;根据所述更新后的每张图像样本的特征向量、以及更新后的所述权重矩阵构建所述损失函数。4.根据权利要求3所述的图像识别模型训练方法,其特征在于,根据所述更新后的每张图像样本的特征向量、以及更新后的所述权重矩阵构建所述损失函数,包括:针对第一图像样本,从更新后的所述权重矩阵中确定所述第一图像样本的类标签值对应的第一中心向量;其中,所述第一图像样本为所述多张图像样本中的任一个;计算所述第一图像样本的特征向量与所述第一中心向量的对称向量之间的第一夹角、所述第一图像样本的特征向量与更新后的所述权重矩阵中的剩余中心向量之间的第二夹角;遍历所述多张图像样本,获得每张图像样本对应的所述第一夹角、所述以及全部的第二夹角;根据预设的图像类别总数和预设参数、图像样本数、每张图像样本对应的所述第一夹角以及全部第二夹角,构建所述损失函数。5.根据权利要求4所述的图像识别模型训练方法,其特征在于,在根据预设的图像类别
总数和预设参数、图像样本数、每张图像样本对应的所述第一夹角以及全部第二夹角,构建所述损失函数的步骤之前,所述方法还包括:从除所述第一图像样本的剩余图像样本中确定第二图像样本,并从更新后的所述权重矩阵中确定与所述第二图像样本的类标签值...

【专利技术属性】
技术研发人员:胡峻毅刘闯叶雨桐陈诗昱
申请(专利权)人:第六镜科技成都有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1