训练图像分类模型的方法技术

技术编号：34600515 阅读：21 留言：0更新日期：2022-08-20 09:03

一种训练神经网络的计算机实现的方法，用于将图像分类为多个类中的一个类，所述方法包括：从所述神经网络提取每个类的多个子类中心向量；将图像输入所述神经网络，其中，所述图像与预定义类相关联；使用所述神经网络生成与所述输入图像对应的嵌入向量；确定所述嵌入向量和所述多个子类中心向量中的每个子类中心向量之间的相似度分数；使用目标函数根据多个所述相似度分数更新所述神经网络的参数；从所述神经网络提取多个更新的参数；根据所述提取的更新参数更新每个子类中心向量。更新参数更新每个子类中心向量。更新参数更新每个子类中心向量。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】训练图像分类模型的方法

[0001]本专利技术涉及训练用于图像分类的神经网络，尤其涉及一种训练用于对具有噪声标签的数据集进行图像分类的神经网络的方法。

技术介绍

[0002]使用带有裕度惩罚的深度卷积神经网络(Deep Convolutional Neural Network，DCNN)嵌入的图像表示是现有图像分类(例如，人脸识别)的首选方法。DCNN通常在姿态归一化步骤之后将图像映射到实现类内紧密性和类间差异的特征嵌入。
[0003]为了训练DCNN，必须将数据集中的每个图像都标记为与身份类相关。每个身份类旨在仅包含特定类型/分类的图像。有几种技术可用来标记每个图像；然而，这类技术有可能导致不正确的标记，称为标签噪声。

技术实现思路

[0004]本说明书公开了用于实现对标签噪声更具鲁棒性的图像分类的神经网络系统。
[0005]根据本专利技术的第一方面，提供了一种训练神经网络的计算机实现的方法，用于将图像分类为多个类中的一个类，所述方法包括：从所述神经网络提取每个类的多个子类中心向量；将图像输入所述神经网络，其中，所述图像与预定义类相关联；使用所述神经网络生成与所述输入图像对应的嵌入向量；确定所述嵌入向量和所述多个子类中心向量中的每个子类中心向量之间的相似度分数；使用目标函数根据多个所述相似度分数更新所述神经网络的参数；从所述神经网络提取多个更新的参数；根据所述提取的更新参数更新每个子类中心向量。
[0006]所述方法还可以包括在更新所述神经网络的所述参数之前：将另一图像输入所...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种训练神经网络的计算机实现的方法，其特征在于，用于将图像分类为多个类中的一个类，所述方法包括：从所述神经网络提取每个类的多个子类中心向量；将图像输入所述神经网络，其中，所述图像与预定义类相关联；使用所述神经网络生成与所述输入图像对应的嵌入向量；确定所述嵌入向量和所述多个子类中心向量中的每个子类中心向量之间的相似度分数；使用目标函数根据多个所述相似度分数更新所述神经网络的参数；从所述神经网络提取多个更新的参数；根据所述提取的更新参数更新每个子类中心向量。2.根据权利要求1所述的方法，其特征在于，所述方法还包括在更新所述神经网络的所述参数之前：将另一图像输入所述神经网络，其中，所述图像与预定义类相关联；使用所述神经网络生成与所述输入图像对应的另一个嵌入向量；确定所述另一个嵌入向量和所述多个子类中心向量中的每个子类中心向量之间的另一个相似度分数；其中，更新所述神经网络的所述参数还基于所述另一个相似度分数。3.根据上述权利要求中任一项所述的方法，其特征在于，所述方法还包括：使用所述相似度分数确定每个类的最接近子类中心向量，其中，所述目标函数包括多中心损失项，所述多中心损失项将所述预定义类中的所述嵌入向量和所述最接近子类中心向量之间的相似度分数与每个其它类中的所述嵌入向量和所述最接近子类中心向量之间的相似度分数进行比较。4.根据权利要求3所述的方法，其特征在于，所述多中心损失项是基于裕度的softmax损失函数。5.根据上述权利要求中任一项所述的方法，其特征在于，所述嵌入向量和每个子类中心向量被归一化，并且所述相似度分数是所述嵌入向量和所述子类中心向量之间的角度。6.根据上述权利要求中任一项所述的方法，其特征在于，每个类包括主导子类，并且所述方法还包括：对于每个类，确定所述类中的主导子类中心向量和每个其它子类中心向量之间的类内相似度分数，其中，所述目标函数包括使用所述类内相似度分数的类内紧密性项。7.根据权利要求6所述的方法，其特征在于，每个子类中心向量被归一化，并且所述类内相似度分数是所述类中的所述主...

【专利技术属性】
技术研发人员：邓健康，斯特凡诺斯，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人